- 數(shù)學(xué)之美讀后感 推薦度:
- 數(shù)學(xué)之美讀后感 推薦度:
- 相關(guān)推薦
數(shù)學(xué)之美讀后感(通用10篇)
當(dāng)看完一本著作后,大家一定都收獲不少,需要寫一篇讀后感好好地作記錄了。想必許多人都在為如何寫好讀后感而煩惱吧,以下是小編收集整理的數(shù)學(xué)之美讀后感,歡迎大家分享。
數(shù)學(xué)之美讀后感 篇1
人們發(fā)現(xiàn)真理的形式上從來都是簡單的,而不是復(fù)雜和含混的。
——牛頓
自小就學(xué)數(shù)學(xué)的我,并不覺得它是美好的。于我而言,數(shù)學(xué)就像緊箍咒一樣,不能提,一提。就頭疼。
而看了吳軍博士所寫的《數(shù)學(xué)之美》后,我對(duì)數(shù)學(xué)的感覺,從以前的被動(dòng)獲取和勉強(qiáng)學(xué)習(xí),變成了強(qiáng)烈熱愛和主動(dòng)積極的學(xué)習(xí)。這原因就在于我發(fā)現(xiàn)了它的價(jià)值,它的一枝獨(dú)秀,不可或缺的地位,數(shù)學(xué)的博大精深和對(duì)其相關(guān)的各類事業(yè)的發(fā)展的價(jià)值已使我深深陶醉其中。這本書中有很多復(fù)雜且長的公式,但這并不妨礙大眾的閱讀,因?yàn)樗⒎窃谟谧屇懔私飧郔T領(lǐng)域的知識(shí),而是用了大量篇幅介紹各個(gè)領(lǐng)域的典故,讓我們感受數(shù)學(xué)思維。這就像李欣教授所說:“成為一個(gè)領(lǐng)域的大師有其偶然性,但更有其必然性。其必然性就是大師們的思維方法!
英國哲學(xué)家弗朗西斯·培根在《論美德》這篇文章中講:“美德就如同華貴的寶石,在樸素的襯托下最顯華麗!睌(shù)學(xué)的美妙,也恰恰在于一個(gè)好的思維,好的方法。
在《數(shù)學(xué)之美》十四章,我被它的標(biāo)題吸引到了。“余弦定理和新聞的分類”,這倆看似八竿子打不著。卻有著緊密的聯(lián)系?梢哉f,新聞的分類很大程度上依賴的是余弦定理。我們都知道,計(jì)算機(jī)處理一個(gè)問題是讓他去算,而不是像人類一樣理解了它,再去解決。而科學(xué)家們遇到這個(gè)問題,卻用了另一種思維,他們把文字的新聞變成一組可計(jì)算的數(shù)字,然后再設(shè)計(jì)一個(gè)算法來算出任意兩篇新聞的相似性。稍詳細(xì)一些就是:對(duì)于一篇新聞中的所有實(shí)詞。計(jì)算出它們的TF-IDF值,再把這些值按照其在對(duì)應(yīng)詞匯表的位置依次排列就得到一個(gè)向量,這即新聞的特征向量。這時(shí),就可以通過計(jì)算兩個(gè)向量夾角來判斷對(duì)應(yīng)的新聞主題的接近程度,這也就要用到余弦定理了。我在必修五數(shù)學(xué)書上學(xué)到余弦定理時(shí),很難想象它可以用來對(duì)新聞進(jìn)行分類。在這里我又一次看到了數(shù)學(xué)工具的用途。
在書中,我也了解到了數(shù)學(xué)的發(fā)展實(shí)際上是不斷的抽象和概括的過程。這些抽象了的方法看似離生活越來越遠(yuǎn),但他們最終能找到應(yīng)用的地方,布爾代數(shù)便是如此。
布爾代數(shù)的簡單不能再簡單了。運(yùn)算的元素只有兩個(gè)0和1,基本的運(yùn)算只有“與”、“或”和“非”。幾乎就是我們現(xiàn)在所學(xué)的“判斷命題真假”。在布爾代數(shù)提出后的80多年里,他確實(shí)沒有什么像樣的應(yīng)用。直到1938年香農(nóng)在他的碩士論文中指出,布爾代數(shù)來實(shí)現(xiàn)開關(guān)電路。才使得布爾代數(shù)成為數(shù)字電路的.基礎(chǔ)。正是依靠這一點(diǎn),人類用一個(gè)個(gè)開關(guān)電路最終“搭出”電子計(jì)算機(jī)。
這些,都能體現(xiàn)作者“簡單即是美”的思想。他在書中也寫道:“數(shù)學(xué)的精彩之處就在于簡單的模型可以干大事!边@些,也都是我從未感受到過的。并且,在這本書中,作者也用了不少篇幅來介紹通信領(lǐng)域的世界級(jí)專家,讓我對(duì)真正的世界級(jí)學(xué)者有更多的了解和理解,比如賈里尼克,Google AK-47的設(shè)計(jì)者——阿米特·辛格博士,自然語言處理的教父米奇·馬庫斯等等。
愛因斯坦說過:“從希臘哲學(xué)到現(xiàn)代物理學(xué)的整個(gè)科學(xué)史中。不斷有人力圖地表面上極為復(fù)雜的自然現(xiàn)象歸結(jié)為幾個(gè)簡單的基本概念和關(guān)系,這就是整個(gè)自然哲學(xué)的基本原理。”這本書把數(shù)學(xué)在IT領(lǐng)域的美麗予以了精彩表達(dá),我也知道,把一件復(fù)雜的事用簡單的語言表達(dá)出來,并非易事,這應(yīng)該也是各界人士都對(duì)這本書予以好評(píng)的原因吧。
當(dāng)然,我也明白,欣賞美不是終極目的,更值得我們追求的是創(chuàng)造美境界。
還有,希望未來的自己,無論生活好與壞,都能少一點(diǎn)浮躁,多一點(diǎn)踏實(shí)和對(duì)自然科學(xué)本質(zhì)的好奇求知。
數(shù)學(xué)之美讀后感 篇2
在網(wǎng)上看到有人推薦吳軍博士的《數(shù)學(xué)之美》,盡管我從事社會(huì)科學(xué)研究,但對(duì)數(shù)學(xué)的推崇一直如此,所以買來一讀,我的真切體驗(yàn)正如吳軍博士在書的后記中所說,把自己“境界提升了一個(gè)層次”。
那么,對(duì)我而言,到底提升了什么境界呢?
首要的肯定是思想境界。在未讀這本書之前,我知道對(duì)于這個(gè)世界的事件形成的信息集合,人類只有兩種方式可以表達(dá),一個(gè)是數(shù)字,一個(gè)是語言。整個(gè)實(shí)數(shù)的集合是無窮個(gè),而且每個(gè)數(shù)字都是唯一的;整個(gè)世界中的事件也是無窮個(gè)的,而且每個(gè)事件也時(shí)獨(dú)一無二的,這樣數(shù)學(xué)中的數(shù)字集合與世界中的事件集合就構(gòu)成一個(gè)一一對(duì)應(yīng)的關(guān)系,所以研究數(shù)字之間的關(guān)系,實(shí)際上就是在研究世界中事件之間的關(guān)系。語言中的概念和世界中的事件之間也是可以構(gòu)成一個(gè)對(duì)應(yīng)關(guān)系的,但問題是,語言中概念的集合是有限的,所以它和數(shù)字集合的對(duì)應(yīng)顯然只能是部分對(duì)應(yīng)。
計(jì)算機(jī)科學(xué)的發(fā)展,人類需要把語言處理成數(shù)字,因?yàn)橛?jì)算機(jī)只能識(shí)別數(shù)字信號(hào),所以“語言的數(shù)字化”成為計(jì)算機(jī)產(chǎn)生以來發(fā)展最快、而且最有創(chuàng)新性的領(lǐng)域,而許多華人科學(xué)家成為了這個(gè)領(lǐng)域的頂尖專家,如李開復(fù),吳軍博士是卓越的科學(xué)家之一。至此我才感到,在計(jì)算機(jī)主導(dǎo)的世界中,信息化就是數(shù)字化,而最難的數(shù)字化、也是最有成就的數(shù)字化,就是對(duì)人類自然語言的數(shù)字化,因?yàn)槿祟惖男畔缀?00%是用語言承載、傳播的,計(jì)算機(jī)要與人對(duì)話,變成智能化的`機(jī)器,首先要解決的就是語言的數(shù)字化問題。但我們?cè)陔娔X上自如地輸入文字時(shí)、或者拿著手機(jī)通話時(shí),我們跟本沒有意識(shí)到,那些卓越的語言科學(xué)家,早已經(jīng)把我們的語言,轉(zhuǎn)化成數(shù)字信號(hào),通過輸入、處理、解碼的方式,讓我們無障礙地聯(lián)絡(luò)、工作。
我似乎感到,語言與數(shù)字的關(guān)系,就是人與自然關(guān)系的接口。套用古希臘畢達(dá)哥拉斯學(xué)派的觀點(diǎn),加上我的理解,即是,數(shù)是萬物的本原,語言是人的本原!
吳軍博士似乎也在提升我對(duì)方法的認(rèn)識(shí)境界?茖W(xué)研究的思考方式,習(xí)慣遵循本質(zhì)、規(guī)律、連續(xù)性思維,在語言學(xué)研究的早期,人類為了讓計(jì)算機(jī)識(shí)別語言,采用建立語言規(guī)則和語言規(guī)則數(shù)據(jù)庫的辦法,但最終以失敗告終(20世紀(jì)50-70年代),70年代后科學(xué)家采用了語言統(tǒng)計(jì)模型,研究取得了突飛猛進(jìn)。語言統(tǒng)計(jì)模型的勝利,再一次證明了宇宙量子模型的信念,世界是不連續(xù)的隨機(jī)性的粒子構(gòu)成,人類數(shù)千年文明進(jìn)化出來的語言系統(tǒng),就是動(dòng)態(tài)的隨機(jī)概率事件。其二,物理思維再也難逃牛頓的經(jīng)典本質(zhì)思維方法,即找尋到百分之百確定性的規(guī)律,而信息論思維是研究如何把握不確定性現(xiàn)象,利用概率統(tǒng)計(jì)是不二法門。其三,語言本質(zhì)上就是信息傳播,只有從通信模型視角才能真正理解計(jì)算機(jī)的功能,對(duì)語言的編碼、處理、傳輸、解碼是計(jì)算機(jī)的強(qiáng)項(xiàng),計(jì)算機(jī)是永遠(yuǎn)不可能理解語言的意思的。
在《數(shù)學(xué)之美》中,吳軍博士對(duì)他的老師、師兄弟、同事的經(jīng)歷、掌故進(jìn)行了敘述,讓我們了解到這些世界一流的學(xué)科家、技術(shù)精英們的為人處世品質(zhì)、鮮明個(gè)性、科學(xué)素養(yǎng)及其管理風(fēng)格。例如賈里尼克對(duì)博士生的嚴(yán)酷淘汰,馬庫斯對(duì)學(xué)生的寬宏大度,但我感到他們有一樣?xùn)|西是共同的,就是對(duì)科學(xué)創(chuàng)造、頂尖人才的識(shí)別和器重,甚至是無條件的包容。如此為人的境界才是根本,因?yàn)閭ゴ蟮目茖W(xué)創(chuàng)造畢竟是人做出來的,只有崇高的人文精神之下才能造就頂尖的人才、一流的科學(xué)和技術(shù)。
觀國內(nèi)的學(xué)說界,官風(fēng)盛行、人情充斥,與這些一流學(xué)說群對(duì)科學(xué)創(chuàng)造的賞識(shí)、對(duì)個(gè)性人才的包容,對(duì)科學(xué)探索的熱誠,可謂相去甚遠(yuǎn)。
看來,我們只能寄希望于年輕一代,但愿吳博士的《數(shù)學(xué)之美》,能讓我們的學(xué)子們,初步體驗(yàn)到科學(xué)精英們卓越的才智與情懷。
數(shù)學(xué)之美讀后感 篇3
我在想,為什么我們要學(xué)習(xí)數(shù)學(xué)?也許這個(gè)問題成年人有一萬個(gè)答案,可是當(dāng)我們第一次走進(jìn)教室,學(xué)習(xí)數(shù)學(xué)的時(shí)候,大概率還是個(gè)孩子,你怎么跟一個(gè)孩子解釋為什么要學(xué)習(xí)數(shù)學(xué)呢?我把這個(gè)問題拋給了一個(gè)朋友,他說:“為了提高思維邏輯能力,這是我初中老師在第一節(jié)數(shù)學(xué)課上告訴我們的”;蛘咭晃5歲的小朋友又會(huì)問:“什么是邏輯能力呢?”
也許從出生第一天,我們就一直在被動(dòng)的接收一些東西,父母的勸導(dǎo),老師的傳授,可5歲的孩子還是會(huì)把玩具散落一地,6歲的孩子仍然會(huì)因?yàn)楦改覆唤o買玩具而嗷嗷大哭,無論你怎么勸導(dǎo)一個(gè)人,怎么勸誡一個(gè)人,他可能仍然會(huì)犯你認(rèn)為會(huì)出現(xiàn)的錯(cuò)誤。我記得有位教育專家這么說:“你告訴寶寶他把玩具弄壞了,就等于丟了10個(gè)棒棒糖”,從此以后這個(gè)寶寶可能會(huì)更加珍惜玩具。這個(gè)方法很簡單,但是貌似最有效。數(shù)學(xué)是什么?數(shù)學(xué)不就是把復(fù)雜的東西簡單化么?
現(xiàn)在我們?cè)倩卮鹎懊娴膯栴}:為什么我要學(xué)習(xí)數(shù)學(xué)?我們可以這么跟5歲的小朋友說:“媽媽給你10元錢,讓你買醬油,醬油7元、棒棒糖1元一個(gè),剩下的錢你可以買幾個(gè)棒棒糖?”或許想吃棒棒糖的就會(huì)苦思冥想一番,或許未來媽媽真的給他10元錢去買醬油,結(jié)果回來就變成了一瓶醬油和3個(gè)棒棒糖;蛘咴龠^一段時(shí)間,這位小朋友會(huì)選擇6元的醬油,因?yàn)榭梢垣@得4個(gè)棒棒糖了。他這么計(jì)算著:7+3和6+4都可以等于10,那么如果要必須買醬油的情況下,1+9也可以等于10。我們都知道也有1元的袋裝醬油,于是9個(gè)棒棒糖到手了。任何知識(shí)的魅力都在于自我的發(fā)現(xiàn),只有你對(duì)它產(chǎn)生了無限的興趣,你就會(huì)不斷的發(fā)現(xiàn)它的美,《數(shù)學(xué)之美》也可以變成《物理之美》。
有些人會(huì)說,上面的'例子是利益驅(qū)動(dòng)型,不是興趣驅(qū)動(dòng)型,對(duì)于一個(gè)孩子來說,你能指望他向成人那樣:“我需要的不是物質(zhì)世界,我需要的是精神世界?”。5歲寶寶最喜歡做得事情就是在吃和玩上面,請(qǐng)問,成年人不也是如此么?這就是天性。只不過成年人的自控能力足夠大罷了。
我們回到書本上,這本書是否合適自己?如果沒有專業(yè)的數(shù)學(xué)知識(shí),很難讀懂。但是它又有著無限的魅力,讓你不自覺的讀下去,為什么?因?yàn)椤皵?shù)學(xué)之美”,雖然大多數(shù)人看不懂里面的公式,但是能夠明白數(shù)學(xué)能解決的問題:概率統(tǒng)計(jì)學(xué)能夠解決自然語言處理、布爾代數(shù)能解決搜索引擎的問題、有限狀態(tài)機(jī)和動(dòng)態(tài)規(guī)劃能解決地圖問題、向量+特征向量+余弦定理能解決自動(dòng)新聞分類問題、最大熵模型解決金融問題,看著看著我就莫名的產(chǎn)生了一種想要學(xué)習(xí)算法的沖動(dòng),這不就是本書的意義所在么?
最后,我推薦幾個(gè)章節(jié)希望有興趣的讀者可以關(guān)注下:
1. 信息指紋,可以讓復(fù)雜的數(shù)據(jù)用簡單的一串?dāng)?shù)字存儲(chǔ)
2. 13章,提到的簡單之美。當(dāng)然之后多次提到
3. 余弦定理(通過向量+特征向量+余弦定理)可以判斷兩條數(shù)據(jù)的相似性
4. 17章,簡單密碼學(xué)(對(duì)密碼感興趣的可以看看)
5. 布隆過濾器,用很少的空間存儲(chǔ)大量的數(shù)據(jù),從而解決黑名單的問題(黑名單數(shù)據(jù)量龐大的時(shí)候,會(huì)增加判斷某一個(gè)名單是否出現(xiàn)過的難度)。
6. 29章,分治算法,雖然沒有很明白算法,但是原理其實(shí)很簡單:把復(fù)雜的東西拆分成若干小的部分,然后進(jìn)行逐個(gè)解決或者說各個(gè)擊破
7. 30章,神經(jīng)網(wǎng)絡(luò),其實(shí)沒那么神秘,神經(jīng)就好比一個(gè)網(wǎng)絡(luò)(馬爾科夫模型+貝葉斯網(wǎng)絡(luò))中的各個(gè)節(jié)點(diǎn)而已。
8. 31章,大數(shù)據(jù),這章是最推薦看的,而且沒有很多專業(yè)的知識(shí),一看就懂。不是什么都可以稱之為大數(shù)據(jù)的,大數(shù)據(jù)需要滿足幾個(gè)條件:數(shù)據(jù)的代表性、數(shù)據(jù)的多維度、數(shù)據(jù)的完備性,F(xiàn)在有很多公司都自稱自己有大數(shù)據(jù),請(qǐng)不要侮辱大數(shù)據(jù)這個(gè)詞。順便說一下像百度這樣的公司,近幾年都在大數(shù)據(jù)上深耕,據(jù)我了解,比如醫(yī)療上面的項(xiàng)目,寧可免費(fèi)做,只要求能夠得到醫(yī)療方面的大數(shù)據(jù),可見其對(duì)大數(shù)據(jù)的重視程度。
數(shù)學(xué)之美讀后感 篇4
在看吳軍的《數(shù)學(xué)之美》之前,我并沒有看過他寫的《浪潮之巔》、《文明之光》等書,但是他主理的得到專欄《硅谷來信》已經(jīng)聽了很久,對(duì)吳軍其人頗為了解——本碩畢業(yè)于清華大學(xué),然后在約翰霍普金斯大學(xué)攻讀博士,02年、10年先后在谷歌和騰訊任職,是著名的自然語言處理和搜索專家,現(xiàn)在主業(yè)是硅谷風(fēng)險(xiǎn)投資。他的專欄宣傳標(biāo)語是“像時(shí)代領(lǐng)航者一樣思考”,吳軍也確實(shí)具有“時(shí)代領(lǐng)航者”那樣的視野和見識(shí),除了專業(yè)領(lǐng)域之外,對(duì)于日常生活和學(xué)習(xí)、職業(yè)發(fā)展也有不俗的見解。
《數(shù)學(xué)之美》最初是吳軍做谷歌研究員時(shí),在谷歌黑板報(bào)上撰寫的一系列文章。雖然谷歌黑板報(bào)的本意是讓吳軍從一個(gè)科學(xué)家的角度介紹一下谷歌的技術(shù),但是他卻更希望“讓做工程的年輕人看到在信息技術(shù)行業(yè)做事情的正確方法”——因?yàn)閰擒妱偟焦雀钑r(shí),發(fā)現(xiàn)谷歌早期的一些算法根本沒有系統(tǒng)的模型和理論基礎(chǔ),而是用“湊”的方法解決問題,工程水平低下。國內(nèi)這種情況就更加泛濫了。
后來,吳軍又將這一系列博客幾乎重寫了一遍,寫成了《數(shù)學(xué)之美》,希望它能向非IT行業(yè)的從業(yè)人員普及一些IT領(lǐng)域的數(shù)學(xué)知識(shí),能成為茶余飯后消遣的科普讀物!笆澜缟献詈玫膶W(xué)者總是有辦法深入淺出地把大道理講給外行聽,而不是故弄玄虛地把簡單的問題復(fù)雜化”,因此吳軍盡力以伽莫夫(《從一到無窮大》作者)、霍金為榜樣,力圖將數(shù)學(xué)之美展示給所有普通讀者。
由于我學(xué)習(xí)過概率論、數(shù)理統(tǒng)計(jì)、數(shù)據(jù)結(jié)構(gòu),整本書看下來,除了某些章節(jié)后的“延伸閱讀”和馬爾可夫鏈等內(nèi)容外,其他都是可以看懂的。其實(shí)看不懂的部分主要是在用數(shù)學(xué)推理證明文中的論點(diǎn),即使不看也不會(huì)影響閱讀體驗(yàn)。
吳軍在扉頁講道:“數(shù)學(xué)之美,首先在于其內(nèi)容或許復(fù)雜而深?yuàn)W,但形式常常很簡單。同時(shí),數(shù)學(xué)之美還在于數(shù)學(xué)原理的通用性和普遍性——數(shù)學(xué)上的一點(diǎn)突破,可以帶動(dòng)很多領(lǐng)域和行業(yè)的進(jìn)步。”
我高中時(shí)曾因?yàn)閿?shù)學(xué)的應(yīng)用不明確而對(duì)其抱有偏見,直到大學(xué)接觸到了數(shù)學(xué)建模。同樣,這本書中講到了許多數(shù)學(xué)在信息技術(shù)工程領(lǐng)域的應(yīng)用,搭建了數(shù)學(xué)與應(yīng)用之間的橋梁。
書中最令人印象深刻的例子就是通信。人與人之間的交流,也算是廣義上的通信,因此通信與我們的生活息息相關(guān)。而數(shù)學(xué)在通信中的應(yīng)用非常普遍,因?yàn)閺碾妶?bào)、電話、電視到互聯(lián)網(wǎng),這些現(xiàn)代通信都遵從著信息論的規(guī)律,而整個(gè)信息論的基礎(chǔ)就是數(shù)學(xué)。不僅如此,整個(gè)人類的自然語言和文字的起源背后,都受到數(shù)學(xué)規(guī)律的支配——因?yàn)閿?shù)字和文字、自然語言一樣,都是信息的載體;語言和數(shù)學(xué)產(chǎn)生的目的都是為了記錄和傳播信息。
一個(gè)典型的通信系統(tǒng)是這樣的:發(fā)送者(人或者機(jī)器)發(fā)送信息時(shí),需要采用一種能在媒體中(比如空氣、電線)傳播的信號(hào),比如語音或者電話線的調(diào)制信號(hào),這個(gè)過程是廣義的編碼。然后通過媒體傳播到接收方,這個(gè)過程是信道傳輸。在接收方,接收者(人或者機(jī)器)根據(jù)事先約定好的方法,將這些信號(hào)還原成發(fā)送者的信息,這個(gè)過程是廣義上的解碼。
我們平時(shí)說話時(shí),大腦就是一個(gè)信息源,聲帶、空氣就是如電線、光纜般的信道,聽眾的耳朵就是接收器,而聲音就是傳送的信號(hào)。根據(jù)聲學(xué)信號(hào)推測說話者的意思,就是語音識(shí)別。
語言實(shí)質(zhì)上是一套編碼、解碼的規(guī)則。從字(字母)到詞的構(gòu)詞法是詞的編碼規(guī)則,這套規(guī)則是完備的(有限且封閉的集合);從詞到句的語法是語言的編碼規(guī)則,這套規(guī)則是不完備的(無限和開放的集合)——任何語言都有語法覆蓋不到的地方。
正是由于語法是不完備的規(guī)則,所以在自然語言處理的研究當(dāng)中,基于規(guī)則的方法走向了一條死路。隨著計(jì)算機(jī)性能和可用數(shù)據(jù)量的增加,基于統(tǒng)計(jì)的方法已經(jīng)被廣泛運(yùn)用到自然語言處理中。書的第2章到第7章,圍繞自然語言處理的統(tǒng)計(jì)學(xué)模型,講述得深入淺出,而且對(duì)科學(xué)界的許多大師級(jí)人物和他們的貢獻(xiàn)都做了介紹。
另一個(gè)絕妙的應(yīng)用案例,是第14章《余弦定理和新聞的分類》。我們?cè)诟咧卸紝W(xué)過用余弦定理判斷兩個(gè)向量之間的夾角大小,然而不知道這樣做有什么實(shí)際意義。如果當(dāng)時(shí)我們的老師能舉出文本分類作為例子,一定能讓同學(xué)們興奮不已。
如果由人來做新聞分類,人一定會(huì)先把文章讀懂。但是計(jì)算機(jī)沒有智能,根本讀不懂新聞,它只擁有強(qiáng)大的計(jì)算能力。這就要求我們把文字組成的新聞變成一組可以計(jì)算的數(shù)字,然后設(shè)計(jì)一個(gè)算法,算出任意兩篇新聞的相似性。
新聞傳遞信息,而詞是信息的載體,“同一類新聞?dòng)迷~都是相似的,不同類的新聞?dòng)迷~各不相同”。當(dāng)剔除掉“的、地、得”和“之乎者也”那樣的助詞和虛詞之后,對(duì)新聞中剩下的實(shí)詞,計(jì)算出每個(gè)詞的出現(xiàn)頻率(實(shí)際上更為復(fù)雜,因?yàn)橹皇且黄x書筆記,我就簡化成“出現(xiàn)頻率”了),再按照詞在詞匯表中出現(xiàn)的順序,將這些頻率值依次排列,就得到了這篇新聞的特征向量。
如果詞匯表中的某個(gè)詞在新聞中沒有出現(xiàn),對(duì)應(yīng)的頻率值為0。如果詞匯表總共有64000個(gè)詞,就會(huì)得到一個(gè)64000維的`特征向量,向量中每一個(gè)維度的大小代表每個(gè)詞對(duì)這篇新聞主題的貢獻(xiàn)。新聞就這樣,從文字變成了數(shù)字。
一篇10000字的文本,它的特征向量各個(gè)維度的數(shù)值普遍比一篇500字的文本要大,因此單純比較各個(gè)維度的大小沒有太大意義。但是,向量的方向卻有很大的意義。如果兩個(gè)向量的方向基本一致,說明它們的新聞?dòng)迷~比例基本一致。
因此,可以通過余弦定理計(jì)算兩個(gè)特征向量之間的夾角,判斷對(duì)應(yīng)的新聞主題的接近程度。在真實(shí)的文本分類聚合過程中,需要自底向上不斷合并,合并的過程中類別越來越少,而每個(gè)類越來越大。
另外值得一提的是,這項(xiàng)研究的動(dòng)機(jī)很有意思。當(dāng)時(shí)某個(gè)國際會(huì)議需要把提交上來的幾百篇論文交給各個(gè)專家評(píng)審,把每個(gè)研究方向的論文交給這個(gè)方向最有權(quán)威的專家。作為會(huì)議程序委員會(huì)主席的雅讓斯基教授為了偷懶,就想了這個(gè)將論文自動(dòng)分類的方法,由他的學(xué)生弗洛里安很快實(shí)現(xiàn)了。
考慮到多次迭代的計(jì)算量,后文又介紹了矩陣奇異值分解的方法,將計(jì)算量縮小到1/6。
此外,書中還介紹了搜索引擎算法、拼音輸入法等應(yīng)用背后的數(shù)學(xué)模型。第19章《談?wù)剶?shù)學(xué)模型的重要性》中用托勒密的地心說模型(大圓套小圓)舉例,講:“正確的數(shù)學(xué)模型在科學(xué)和工程中至關(guān)重要,而發(fā)現(xiàn)正確模型的途徑往往是曲折的。正確的模型在形式上通常是簡單的。”
其實(shí)這本書中,除了IT領(lǐng)域的數(shù)學(xué)應(yīng)用之外,還有許多值得深挖的地方?磿倪^程中,我有時(shí)會(huì)突然從書中的觀點(diǎn)聯(lián)想到其他地方看過的觀點(diǎn)。比如講信息和情報(bào)時(shí)說到斯大林在中蘇邊界的60萬大軍不敢輕易調(diào)到歐洲戰(zhàn)場,就聯(lián)系到《日本大敗局》里日本明知必?cái)s執(zhí)意南下進(jìn)攻,偷襲珍珠港;比如講信息論中“冗余度”的概念時(shí),聯(lián)系到羅胖“冗余度大是優(yōu)勢,信息傳播效率反而高”的看法;講到數(shù)學(xué)模型的重要性時(shí),想到黎曼的非歐幾何對(duì)相對(duì)論、超空間研究的重大意義……
其實(shí)大多情況下,看書只是用來怡情、消遣的手段,和打牌、玩游戲本質(zhì)上是一樣的。讀書的過程中經(jīng)常會(huì)靈光乍現(xiàn),這就是讀書的樂趣。
數(shù)學(xué)之美讀后感 篇5
吳軍2012年的作品,源于其在谷歌黑板報(bào)的系列文章,講述數(shù)學(xué)方法在信息技術(shù)中的應(yīng)用,說明了為什么科學(xué)研究中方法論如此的重要,以及數(shù)學(xué)如何簡單優(yōu)雅地解決問題,直達(dá)本質(zhì)。對(duì)比他的其他作品比如《浪潮之巔》、《硅谷之謎》,本書比較偏技術(shù),屬于目前大熱的數(shù)據(jù)科學(xué)(Data Science)范疇,在云計(jì)算、大數(shù)據(jù)和人工智能等成為常態(tài)和趨勢的今天,適合所有對(duì)IT技術(shù)及相關(guān)管理人員閱讀。對(duì)我而言,最大的收獲包括:
規(guī)則vs算法:自然語言處理,在早期幾十年基于文法規(guī)則都無法達(dá)到可應(yīng)用的效果,終于在轉(zhuǎn)變?yōu)榛诮y(tǒng)計(jì)方法且積累了足夠數(shù)據(jù)后,形成了突破,達(dá)到了今日可大規(guī)模商用的效果。再次說明了數(shù)據(jù)及算法在今日的重要性。
一些常見應(yīng)用涉及的優(yōu)化算法:搜索相關(guān)(分詞、網(wǎng)絡(luò)爬蟲、索引、結(jié)果排名、廣告及反作弊)、文本處理(新聞分類、廣告相關(guān)性、輸入法)、地圖路線規(guī)劃、信息指紋、密碼學(xué)等。這些算法不止適用于這些應(yīng)用場景,還可以在其他許多地方借鑒,比如用戶評(píng)論分析也需要用分詞和語義分析,許多價(jià)值優(yōu)化算法都需要用到期望值最大化和邏輯回歸等。
優(yōu)雅的`理論模型:在初始階段,出于時(shí)間和成本考慮,在技術(shù)實(shí)現(xiàn)上可能會(huì)使用一些拼湊的方法,甚至山寨,但是這種方法并不可持續(xù),很難進(jìn)行系統(tǒng)化的優(yōu)化,開發(fā)維護(hù)成本都很高,最終會(huì)遇到災(zāi)難性問題。做事情需要有境界,最求簡單而優(yōu)雅的理論和工程實(shí)現(xiàn),這在長期是非常有好處的。
吳軍使用淺顯易懂的語言,把解決問題的思路和復(fù)雜的數(shù)學(xué)模型講得很清楚,雖然理解延伸閱讀里的具體數(shù)學(xué)公式還是有些挑戰(zhàn)。其實(shí)重要的是思想和方法,具體的實(shí)現(xiàn)可以在用到時(shí)再進(jìn)一步的了解。如何用簡單的語言把復(fù)雜的技術(shù)講清楚,也是我工作的需要,要不斷學(xué)習(xí)磨練。書里提到了啟發(fā)吳軍這方面能力的兩本書,即《從0到無窮大》和《時(shí)間簡史》,會(huì)有要去看下。
數(shù)學(xué)之美讀后感 篇6
重復(fù)的體力勞動(dòng)已經(jīng)被機(jī)器取代,重復(fù)的腦力勞動(dòng)也將被AI取代。
目前的算法更多的是從統(tǒng)計(jì)學(xué)、概率論角度來執(zhí)行,其算法依靠人為設(shè)定執(zhí)行,今后AI的介入,算法會(huì)趨于自我迭代、自我演化。
就整體而言機(jī)器的搜索、篩選、分析、邏輯推理等,都是基于當(dāng)前情況最大概率決策。即通過算法計(jì)算下一步所有可能情況的概率分布,然后得出實(shí)現(xiàn)目標(biāo)哪種決策成功概率最高,即為下一步的方案。
在這種環(huán)境下人最好的`方式便是與機(jī)器合作,將資源分配到這些大概率事件上,當(dāng)然也會(huì)有一部分人懷有賭徒心態(tài),將資源,甚至全部資源分配到小概率事件上,幻想出現(xiàn)奇跡,而這件事就叫“創(chuàng)新”。
但“創(chuàng)新”才是真正的未來,因?yàn)閺挠钪娼嵌葋砜,人類誕生的幾率不到萬億分之一,而這是多么偉大的奇跡,又是多么偉大的創(chuàng)新!
數(shù)學(xué)之美讀后感 篇7
《數(shù)學(xué)之美》,一個(gè)從事多年工作的谷歌研究員眼中的數(shù)學(xué)。令我大飽眼福的是,大學(xué)里面的數(shù)學(xué)知識(shí)竟能如此廣泛運(yùn)用到了計(jì)算機(jī)行業(yè)中。
在語音識(shí)別、翻譯,還有密碼學(xué)領(lǐng)域,有著許多基于概率統(tǒng)計(jì)的模型和思想。當(dāng)然,貝葉斯公式是基礎(chǔ),應(yīng)用到隱含馬爾科夫鏈模型,神經(jīng)網(wǎng)絡(luò)模型。
在搜索中,一些相關(guān)性的計(jì)算,無不用到了概率的知識(shí)。在新聞分類中,用到了一些有關(guān)矩陣特征值、相似對(duì)角化的知識(shí)。當(dāng)然,在圖像處理方面,矩陣變換可謂是無處不在。另外,在識(shí)別方面,有一些通信模型,涉及到了信道、誤碼率、信息熵。
最近剛開學(xué)也沒什么事,所以就想隨便找?guī)妆緯匆幌,但最好別是那種太艱深晦澀的書。8月份一直到現(xiàn)在,吳軍寫的這本12年5月出版的《數(shù)學(xué)之美》一直盤踞京東、亞馬遜等各大網(wǎng)上商城科技類圖書的榜首,當(dāng)然,還有早些時(shí)候出版的《浪潮之巔》也排在很靠前的位置。心想市場的力量應(yīng)該能幫我挑出好書吧,于是就從圖書館借了一本來,一直到今天晚上把它給看完了。
因此想寫一點(diǎn)東西來總結(jié)、反思一下,反正剛開完班會(huì)也沒什么事干。
寫在前面的建議:如果你不討厭數(shù)學(xué)的話,強(qiáng)烈推薦這本書,網(wǎng)上也可以下到電子版,不過閱讀感覺上還是很不一樣的。
廢話就不多說了,《數(shù)學(xué)之美》其實(shí)是一本科普類的讀物,所面向的是接受過普通高等教育的人,完全不需要在特定領(lǐng)域有很深的造詣就可以看懂,大概懂一點(diǎn)線性代數(shù)、概率統(tǒng)計(jì)、組合數(shù)學(xué)、信息論、計(jì)算機(jī)算法、模式識(shí)別最好(雖然列舉了這么多,其實(shí)有些不懂也沒關(guān)系……),所以尤其適合信科的人看。內(nèi)容大部分是和人工智能、計(jì)算機(jī)相關(guān)的,這并非我所學(xué)的專業(yè),但作者比較擅長將看似復(fù)雜的原理用簡明的語言表達(dá)出來,所以可讀性還是很好的。
吳軍是清華大學(xué)畢業(yè)的,之前任職于Google,后來到了騰訊,這些文章都是發(fā)表在Google黑板報(bào)上的,后來經(jīng)過了重寫,所以網(wǎng)上下載的和書本內(nèi)容有所差異。由于吳軍本人是研究自然語言處理和語音識(shí)別的,所以統(tǒng)計(jì)語言模型的東西可能會(huì)多一點(diǎn),不過我覺得這絲毫不妨礙全書數(shù)學(xué)之美的展現(xiàn)……感覺收獲還是挺多的,知識(shí)上的有一些,但更多還是思維方式上的。作者舉了很多例子試圖讓人明白很多看似復(fù)雜的高科技背后,基本原理其實(shí)是出乎意料簡單的(當(dāng)然,必須承認(rèn)第一個(gè)想到這些方法的人還是非常了不起的……)。比如高準(zhǔn)確率的機(jī)器翻譯,看上去好像是計(jì)算機(jī)能夠理解各國語言,隱藏在背后的卻是很多具有大學(xué)理科學(xué)歷的人都非常清楚的統(tǒng)計(jì)模型和概率模型;再比如拼音輸入法的數(shù)學(xué)原理,早期的研究主要集中在縮短平均編碼長度,比如曾經(jīng)流行一時(shí)的五筆輸入法,而現(xiàn)今真正實(shí)用的輸入法卻是有很多信息冗余、編碼長度比較長的拼音輸入法,作者從信息論和市場的角度做了簡單的闡述;又比如新聞的自動(dòng)分類,許多非IT領(lǐng)域的人可能會(huì)認(rèn)為計(jì)算機(jī)可以讀懂新聞并進(jìn)行分類,而實(shí)際上只是特征向量的抽取、多維空間中向量夾角的計(jì)算,非常非常簡單,但凡學(xué)過一點(diǎn)線性代數(shù)的人絕對(duì)是一看就懂的……當(dāng)然,完美的實(shí)現(xiàn)還需要考慮很多細(xì)節(jié)和現(xiàn)實(shí)的情況,但這并不是這本書所關(guān)注的.地方,數(shù)學(xué)之美在于其簡潔而不是繁瑣。
除了對(duì)于具體信息技術(shù)的剖析之外,作者還花了很大篇幅來講一些杰出人士的成長過程,特別是把這些人的成長經(jīng)歷和中國學(xué)生的成長經(jīng)歷作對(duì)比。雖然作者并沒有明說,但字里行間多少流露出對(duì)于中國高等教育以及很多中國企業(yè)的批評(píng),一是教育的功利性,缺乏寬松的獨(dú)立思考的環(huán)境,即使學(xué)了一堆理論也難有用武之地,自然也就缺乏創(chuàng)新性的成果;二是中國企業(yè)的短視,大部分都不舍得在新框架開發(fā)上投資,而是坐享學(xué)術(shù)界和國外企業(yè)的研究成果。
總結(jié)一下呢,《數(shù)學(xué)之美》事實(shí)上不能帶給你編程能力的提升,也沒法讓人的數(shù)學(xué)水平有顯著的提升,但它在很大程度上讓你跳出教科書式的繁瑣細(xì)節(jié)的束縛,能夠從更宏觀的角度來思考信息世界背后的數(shù)學(xué)引擎的運(yùn)行原理,讓人明白看似很高級(jí)、復(fù)雜的東西背后其實(shí)并不如我們所想象的那樣復(fù)雜,而我們所學(xué)的“枯燥”的數(shù)學(xué)真的可以“四兩撥千斤”,改變億萬人的生活。
數(shù)學(xué)之美讀后感 篇8
本書介紹了Google產(chǎn)品中涉及的自然語言處理、統(tǒng)計(jì)語言模型、中文分詞、信息度量、拼音輸入法、搜索引擎、網(wǎng)頁排名、密碼學(xué)等內(nèi)容背后的數(shù)學(xué)原理。讓我們看到了布爾代數(shù)、離散數(shù)學(xué)、統(tǒng)計(jì)學(xué)、矩陣計(jì)算、馬爾科夫鏈等似曾相識(shí)的內(nèi)容在實(shí)際生活中的應(yīng)用。相比于其他數(shù)學(xué)題材書籍,吳軍老師把抽象、深?yuàn)W的數(shù)學(xué)方法解釋得通俗易懂,書中同時(shí)引用了諸多的歷史典故和人物介紹,給人以很多啟發(fā),也讓人由衷感嘆數(shù)學(xué)的簡潔和強(qiáng)大。
雖是數(shù)據(jù)專業(yè)畢業(yè),但是才疏學(xué)淺,無力對(duì)數(shù)學(xué)的美進(jìn)行闡述。僅就書中兩個(gè)比較喜歡的地方發(fā)表一點(diǎn)不成熟的見解,與諸位共勉。
其一,在講Google的搜素引擎反作弊時(shí)談到做事情的兩種境界“道”和“術(shù)”,術(shù)就是具體的做事方法,而道則是隱藏在問題背后的動(dòng)機(jī)和本質(zhì)。在術(shù)這個(gè)層面解決問題要付出更多的努力,有點(diǎn)類似于我們常說的“頭疼醫(yī)頭,腳疼醫(yī)腳”,暫時(shí)不疼了,過幾天復(fù)發(fā)了,再去醫(yī)治,如此往復(fù),無法從根本上解決;而只有找到了致病原因,才能做到藥到病除,根本治愈。本人之前參與過行內(nèi)月終自動(dòng)核對(duì)的研發(fā),月終核對(duì)初期數(shù)據(jù)的不一致性只能靠數(shù)百業(yè)務(wù)人員人工核對(duì)數(shù)據(jù)差異,然后修改數(shù)據(jù),每月1日都要加班加點(diǎn),工作量很大,這是從術(shù)上解決問題。后來找到了產(chǎn)生差異的原因是會(huì)計(jì)核算時(shí)的利息調(diào)整造成的,把這些數(shù)據(jù)接過來進(jìn)行相應(yīng)沖減后差異就消失了,業(yè)務(wù)人員也不用來加班了,這才是從道上解決問題。
其二,是在做中文網(wǎng)頁排名時(shí)提到的.從業(yè)界成功的秘訣之一:“先幫助用戶解決80%的問題,再慢慢解決剩下的20%的問題。許多時(shí)候做事失敗,不是因?yàn)槿瞬粔騼?yōu)秀,而是做事的方法不對(duì)。一開始追求大而全的解決方案,之后長時(shí)間不能完成,最后不了了之”。我們?cè)谧鲰?xiàng)目時(shí)也是一樣,業(yè)務(wù)有時(shí)要的功能非常急,可能有些功能也實(shí)現(xiàn)不了(比如系統(tǒng)響應(yīng)時(shí)間長、查詢明細(xì)不能支持省行等)。這時(shí)我們就要將焦點(diǎn)關(guān)注在那些可以實(shí)現(xiàn)的80%的功能上,哪怕剛剛上線的系統(tǒng)界面丑點(diǎn),操作復(fù)雜點(diǎn),反應(yīng)速度慢點(diǎn),但是至少業(yè)務(wù)有可用的系統(tǒng),剩下時(shí)間再去優(yōu)化那剩下的20%。這樣可以幫助我行搶占先機(jī),在與同行業(yè)的競爭中取得主動(dòng)。如果等待我們把所有的細(xì)節(jié)都搞清楚再動(dòng)手開發(fā),力求完美,那么很可能系統(tǒng)能夠上線的時(shí)候業(yè)務(wù)已經(jīng)不需要了。
數(shù)學(xué)之美,也就是簡單之美。希望大家能夠喜歡數(shù)學(xué),喜歡數(shù)學(xué)之美。
數(shù)學(xué)之美讀后感 篇9
這本書一共3章,主要介紹了這些數(shù)學(xué)方法:統(tǒng)計(jì)方法、統(tǒng)計(jì)語言模型、中文信息處理、隱含馬爾科夫模型、布爾代數(shù)、圖論、網(wǎng)頁排名技術(shù)、信息論、動(dòng)態(tài)規(guī)劃、余弦定理、矩陣運(yùn)算、信息指紋、密碼學(xué)、搜索技術(shù)、數(shù)學(xué)模型、最大熵模型、拼音輸入法、貝葉斯網(wǎng)絡(luò)、句法分析、維特比算法、各個(gè)擊破算法等。從第一章開始其明了幽默的語言就深深的吸引了我,讓我覺得如果早一點(diǎn)看這本書,也許數(shù)學(xué)之于我就是另一番天地。
第一章里作者從原始人類的通信方式開始入手,人類最早利用聲音進(jìn)行的通信依賴于開篇給出的"編碼-傳輸-解碼"的基本原理,指出原始人的通信方式和今天的通信方式?jīng)]什么不同,這世界上近現(xiàn)代最普遍的原理大部分都在人類發(fā)展的歷史上被無意識(shí)的使用著。
第六章信息論給出了信息的度量,它是基于概率的,概率越小,其不確定性越大,信息量就越大。引入信息量就可以消除系統(tǒng)的不確定性,同理自然語言處理的大量問題就是找相關(guān)的信息。信息熵的物理含義是對(duì)一個(gè)信息系統(tǒng)不確定性的度量,這一點(diǎn)與熱力學(xué)中的熵概念相同,看似不同的學(xué)科之間也會(huì)有著很強(qiáng)的相似性。事務(wù)之間是存在聯(lián)系的,要學(xué)會(huì)借鑒其他知識(shí)。
這本書里也能找到不少在學(xué)的課程知識(shí),如大學(xué)專業(yè)課里,數(shù)電總是要比模電簡單不少,而自然界里大部分的信號(hào)都屬于模擬信號(hào)。所謂模擬信號(hào),是指從時(shí)間和數(shù)值兩種維度上看來都是連續(xù)變化的信號(hào)。在實(shí)際電路中,模數(shù)轉(zhuǎn)換是一個(gè)很重要的過程,將預(yù)處理的模擬信號(hào)經(jīng)過模數(shù)變換為數(shù)字信號(hào),然后進(jìn)行數(shù)字信號(hào)處理。而數(shù)字化處理有很多優(yōu)點(diǎn),比如功能強(qiáng)大、抗干擾能力強(qiáng)、易于傳輸?shù)取?/p>
簡而言之,如果沒有數(shù)學(xué),就沒有數(shù)字信號(hào)處理和傳輸?shù)母拍睿鴶?shù)字信號(hào)傳輸在當(dāng)下大規(guī)模的集成電路里是必不可少的,這是通信成功的基本要求。
作者把生活中遇到的復(fù)雜的問題,以簡單清晰,直觀的模型或者公式展現(xiàn)出來。我們可能過于注意生活中的種種奇妙現(xiàn)象,往往忽略了追求其理論邏輯的演繹,而這,也是大部分問題的主要根源。
羅素曾經(jīng)說過:"數(shù)學(xué),如果正確地看,不但擁有真理,而且也具有至高的美";愛因斯坦也曾說過:"純數(shù)學(xué)使我們能夠發(fā)現(xiàn)概念和聯(lián)系這些概念的`規(guī)律,這些概念和規(guī)律給了我們理解自然現(xiàn)象的鑰匙。"數(shù)學(xué)在所有科學(xué)領(lǐng)域起著基礎(chǔ)和根本的作用。"哪里有數(shù),哪里就有美".在這里,我也想把《數(shù)學(xué)之美》真誠推薦給每一位對(duì)自然、科學(xué)、生活有興趣有熱情的朋友,不管你是從事職業(yè),讀一讀它,會(huì)讓你受益良多。
吳軍老師在《數(shù)學(xué)之美》中提到:"這本書的目的是講道而不是講術(shù)。很多具體的搜索技術(shù)很快會(huì)從獨(dú)門絕技到普及,再到落伍,追求術(shù)的人一輩子工作很辛苦。只有掌握了搜索的本質(zhì)和精髓才能永遠(yuǎn)游刃有余".回到我們?nèi)粘5纳钪,需要學(xué)習(xí)的東西、技術(shù)太多太多,如果一味地只為去追技術(shù)的腳步,那么我們也會(huì)很累很累。然而基本的原理卻是沒有怎么變化的。只見森林,不見樹木,難免迷失;站在高處向下看,也許我們一直看不到底,但是站在底處卻是可以看見底的。
數(shù)學(xué)之美讀后感 篇10
確切的來說,《數(shù)學(xué)之美》并不是一本書,它是谷歌黑板報(bào)中的一系列文章,介紹數(shù)學(xué)在信息檢索和自然語言處理中的主導(dǎo)作用和奇妙應(yīng)用,每一篇文章都不長,但小中見大,從看似高深的高科技中用通俗易懂的案例展示了數(shù)學(xué)之美,深深的吸引了我。
這一系列文章的作者是google公司的科學(xué)家吳軍。他畢業(yè)于清華大學(xué)計(jì)算機(jī)系(本科)和電子工程系(碩士),并于1993-1996年在清華任講師。他于1996年起在美國約翰霍普金斯大學(xué)攻讀博士,并于XX年獲得計(jì)算機(jī)科學(xué)博士學(xué)位。在清華和約翰霍普金斯大學(xué)期間,吳軍博士致力于語音識(shí)別、自然語言處理,特別是統(tǒng)計(jì)語言模型的研究。他曾獲得1995年的全國人機(jī)語音智能接口會(huì)議的最佳論文獎(jiǎng)和XX年eurospeech的最佳論文獎(jiǎng)。
吳軍博士于XX年加入google公司,現(xiàn)任google研究院資深研究員。到google不久,他和三個(gè)同事們開創(chuàng)了網(wǎng)絡(luò)搜索反作弊的研究領(lǐng)域,并因此獲得工程獎(jiǎng)。XX年,他和兩個(gè)同事共同成立了中日韓文搜索部門。吳軍博士是當(dāng)前google中日韓文搜索算法的主要設(shè)計(jì)者。在google其間,他領(lǐng)導(dǎo)了許多研發(fā)項(xiàng)目,包括許多與中文相關(guān)的產(chǎn)品和自然語言處理的項(xiàng)目,并得到了公司首席執(zhí)行官埃里克.施密特的高度評(píng)價(jià)。吳軍博士在國內(nèi)外發(fā)表過數(shù)十篇論文并獲得和申請(qǐng)了近十項(xiàng)美國和國際專利。他于XX年起,當(dāng)選為約翰霍普金斯大學(xué)計(jì)算機(jī)系董事會(huì)董事。
正是他在信息檢索與自然語言處理領(lǐng)域中的一系列工作,使他講述了我所看到的內(nèi)容-數(shù)學(xué)之美。
看了數(shù)學(xué)之美,立即聯(lián)想到了金庸小說中的武林高人,總是把一套大多數(shù)人都會(huì)的入門功夫使得威力無比,擊潰眾多敵者。東西放在那,它的威力如何,并鍵在于使用者,武術(shù)如此,數(shù)學(xué)同樣如此。
于我而言,語音視別是一類高科技,作為非專業(yè)人土,深覺高奧。但看完數(shù)學(xué)之美之后,頓感驚詫,原來如此深?yuàn)W東西的解決方法自己也學(xué)過,并且理工科讀過大學(xué)的人都學(xué)過,那就是統(tǒng)計(jì)學(xué)中的條件概率p(a/b),即b事件發(fā)生條件下a事件發(fā)生的概率。
如果s表示一連串特定順序排列的詞w1,w2,…,wn,換句話說,s可以表示某一個(gè)由一連串特定順序排練的詞而組成的一個(gè)有意義的句子,F(xiàn)在,機(jī)器對(duì)語言的識(shí)別從某種角度來說,就是想知道s在文本中出現(xiàn)的可能性,也就是數(shù)學(xué)上所說的s的`概率用p(s)來表示。利用條件概率的公式,s這個(gè)序列出現(xiàn)的概率等于每一個(gè)詞出現(xiàn)的概率相乘,于是p(s)可展開為:
p(s)=p(w1)p(w2|w1)p(w3|w1w2)…p(wn|w1w2…wn-1)
其中p(w1)表示第一個(gè)詞w1出現(xiàn)的概率;p(w2|w1)是在已知第一個(gè)詞的前提下,第二個(gè)詞出現(xiàn)的概率;以次類推。不難看出,到了詞wn,它的出現(xiàn)概率取決于它前面所有詞。從計(jì)算上來看,各種可能性太多,無法實(shí)現(xiàn)。因此我們假定任意一個(gè)詞wi的出現(xiàn)概率只同它前面的詞wi-1有關(guān)(即馬爾可夫假設(shè)),于是問題就變得很簡單了,F(xiàn)在,s出現(xiàn)的概率就變?yōu)椋?/p>
p(s)=p(w1)p(w2|w1)p(w3|w2)…p(wi|wi-1)…
(當(dāng)然,也可以假設(shè)一個(gè)詞又前面n-1個(gè)詞決定,模型稍微復(fù)雜些。)
接下來的問題就是如何估計(jì)p(wi|wi-1),F(xiàn)在有了大量機(jī)讀文本后,這個(gè)問題變得很簡單,只要數(shù)一數(shù)這對(duì)詞(wi-1,wi)在統(tǒng)計(jì)的文本中出現(xiàn)了多少次,以及wi-1本身在同樣的文本中前后相鄰出現(xiàn)了多少次,然后用兩個(gè)數(shù)一除就可以了,p(wi|wi-1)=p(wi-1,wi)/p(wi-1)。
也許很多人不相信用這么簡單的數(shù)學(xué)模型能解決復(fù)雜的語音識(shí)別、機(jī)器翻譯等問題。其實(shí)不光是常人,就連很多語言學(xué)家都曾質(zhì)疑過這種方法的有效性,但事實(shí)證明,統(tǒng)計(jì)語言模型比任何已知的借助某種規(guī)則的解決方法都有效。比如在google的中英文自動(dòng)翻譯中,用的最重要的就是這個(gè)統(tǒng)計(jì)語言模型。去年美國標(biāo)準(zhǔn)局(nist)對(duì)所有的機(jī)器翻譯系統(tǒng)進(jìn)行了評(píng)測,google的系統(tǒng)是不僅是全世界最好的,而且高出所有基于規(guī)則的系統(tǒng)很多。
這就是數(shù)學(xué)的美妙之處了,它把一些復(fù)雜的問題變得如此的簡單。
看到《數(shù)學(xué)之美》,在感嘆數(shù)學(xué)的美妙與神奇之處時(shí),自然而然聯(lián)系到自己專業(yè)(地質(zhì)工程而或巖土工程)中的數(shù)學(xué)應(yīng)用。
現(xiàn)在找文獻(xiàn),搜索期刊一大堆基于數(shù)學(xué)的專業(yè)文獻(xiàn),灰色數(shù)學(xué)的、模糊數(shù)學(xué)的、非線性的、系統(tǒng)的,等等,這么多的數(shù)學(xué)的使用,促進(jìn)了一大批的文章,但這些數(shù)學(xué)方法的應(yīng)用究竟是發(fā)現(xiàn)了哪些問題?還是解決了實(shí)際問題嗎?還是僅發(fā)了文章,滿足了需求?現(xiàn)實(shí)是文章好發(fā),用著難用,解決問題還得傳統(tǒng)的方法,那么是這些數(shù)學(xué)方法不行,還是用的太膚淺,根本沒發(fā)揮其威力來?如果沒有發(fā)揮出威力來,那怎么用?怎么發(fā)揮?
【數(shù)學(xué)之美讀后感】相關(guān)文章:
和諧之美02-17
語文橋之美教案08-26
橋之美教學(xué)反思01-01
冬之美優(yōu)秀作文03-06
秋之美優(yōu)秀作文03-05
細(xì)節(jié)之美繪宏圖08-28
四季之美03-08