集體智慧編程

出版時間:2008-3-1  出版社:東南大學出版社  作者:西格蘭  頁數:334  字數:378000  
Tag標簽:無  

內容概要

想要探尋搜索排名、產品推薦、社會化書簽和在線匹配背后的力量嗎?這本頗具魅力的書籍向你展現如何創(chuàng)建Web 2.0應用程序,從參與性?Internet應用程序產生的大量數據中挖掘金礦。運用本書中介紹的先進算法,你可以編寫聰明的程序,以訪問其他網站那些有趣的數據集,從自有應用程序的用戶中收集數據,或者分析和理解你所發(fā)現的數據?!  都w智慧編程》將你帶入機器學習和統計的世界,并且闡釋了如何從你和他人每天收集的信息中獲得關于用戶體驗、市場營銷、個性品味及人類行為的結論。每個算法的描述都十分簡明清晰,相關代碼均可以立即用于你的網站、博客、Wiki或特定應用程序。本書講解了下列主題:  可以讓在線零售商推薦產品或媒體的協作過濾技術  用于在大數據集中發(fā)現同類項組的聚類方法  從數以百萬計可能方案中選擇問題最佳解決方案的最優(yōu)化算法  貝葉斯過濾,用在基于單詞類型和其他特征的垃圾信息過濾中  支持向量(support-vector)機器,用于在線交友網站中的速配  用于問題解決的演化智能——計算機如何通過多次玩同樣的游戲,改進自身代碼并獲得技能提升  每一章都包含了相關練習,可通過擴展使算法變得更強大。超越簡單的數據庫支持應用程序模式,讓 Internet數據財富為你所用。

書籍目錄

ForewordPreface1. Introduction to Collective Intelligence What Is Collective Intelligence? What Is Machine Learning? Limits of Machine Learning Real-Life Examples Other Uses for Learning Algorithms2. Making Recommendations Collaborative Filtering Collecting Preferences Finding Similar Users Recommending Items  Matching Products  Building a del.icio.us Link Recommender Item-Based Filtering Using the MovieLens Dataset User-Based or Item-Based Filtering? Exercises 3. Discovering Groups 4. Searching and Ranking5. Optimization 6. Document Filtering 7. Modeling with Decision Trees 8. Building Price Models 9. Advanced Classification: Kernel Methods and SVMs 10. Finding Independent Features 11. Evolving Intelligence 12. Algorithm Summary

編輯推薦

  “好極了!我無法想象會有更好的方式來開始學習這些算法和方法,也沒有更好的方式能讓我(一個人工智能老家伙)頭腦中關于它們的細節(jié)知識迅速復蘇?!薄  癟oby的書非常成功地將復雜的機器學習算法問題分解為現實而易理解的例子,可直接用于分析當前Web上的社會化交互行為。如果我在兩年前擁有這《集體智慧編程(影印版)》,一定會省下大把浪費在迷途歧路上的寶貴時間”。

圖書封面

圖書標簽Tags

評論、評分、閱讀與下載


    集體智慧編程 PDF格式下載


用戶評論 (總計88條)

 
 

  •   事實上,這些常用的智能算法基本上都是從工程應用中被發(fā)明并得到發(fā)展的,基本上都沒有非常嚴格的數學理論基礎。我個人還是比較了解這些算法的,而且有不少工科的同學也了解而且平??蒲幸灿眠^,并沒有感覺到需要深厚的數學基礎。不過就我了解的情況,好像這些方法在國內IT開發(fā)領域使用得并不太多吧(從我找工作多次面試中交談時感覺到的,面試官大都知道這些方法但也不太熟悉),好像只是高校里面做些科研或工程項目在使用。僅知道有位在土豆網的師兄說有用到,他以前學這個的時候也沒覺得有多大用處似的。有興趣的可以去google看一下http://books.google.com/books?id=fEsZ3Ey-Hq4C&printsec=frontcover&dq=collective+intelligence&ei=QvyESouoIYLckATK4ICCCg#v=onepage&q=&f=falsePS:這本是英文版本的哦
  •   算法實現清晰易懂,一周就可以過一遍。算法思路可以用到各處。
  •   這本書也是朋友推薦的,相當不錯,還是英文的,喜歡編程的朋友一定要看一下.
    希望中文版早點到貨,呵呵,英文畢竟看起來有點累.
  •   很多python代碼
  •   沒學過python 也不知道他這東西都是在哪個平臺弄的,windows還是linux 弄的我自己做的時候沒一個項目成功的,,現在放下了,,看到第二章項目沒弄好,就放下了,,以后再看吧
  •   挺好的,一部外文圖書,對業(yè)內研究人員很有幫助-----
  •   很基本的書適合入門
  •   有空仔細讀一讀
  •   當當這次真的很不錯。
  •   很不錯的一本書哦,推薦大家一看
  •   之前看過中文版,感覺內容很好,很系統,是一本好書,是研究個性化推薦人員的不可多得的一本參考書。想買本英文版的看看。美中不足是,書的邊緣又被擠壓變形了,和上次在當當買的“c primer plus”一樣,又是"九成新"......
  •     看此書之前的想法:
       好似很多人推薦此書入門。我對入門書籍的看法是能夠快速地讓讀者感受到idea,給讀者一副地圖,指導讀者之后的方向選擇。所以我猜想這本書就是以web上通俗易懂的方法介紹machine learning algorithms.而我讀這本書的目的就是想了解一下machine learning, 方便畢業(yè)論文。
      
      現在看這本書的感受:
       有一種刷新讀書觀的感覺,every step with some mathematics is not discussed!!! 通過介紹一些樸素至極的idea,然后用python給出code,結合一個API演示一下??粗a,腦子里還需要還原成數學公式,再想這些數學公式的含義,參數的含義。我想這就是大部分人閱讀此書的過程。所以我現在放棄此書,我認為這樣的學習成本過高,看了code之后,不會對公式有更多的理解,也不會對這些算法有更多的理解,一本書讀完對算法的認識還是相當樸素。但我覺得可以收獲到的就是對數據處理的一個流程的把握,這當然也是入門者需要的。
       所以我覺得這本書應該這樣用:了解machine learning 算法之后,用python 實現一遍,以本書為實驗指導。這樣即鍛煉了編程能力也對之前學習過的算法印象更深了。
  •     機器學習經典書籍
      
       http://suanfazu.com/discussion/109/
      
      
      作者Toby Segaran也是《BeautifulData : The Stories Behind Elegant Data Solutions》(《數據之美:解密優(yōu)雅數據解決方案背后的故事》)的作者。這本書最大的優(yōu)勢就是里面沒有理論推導和復雜的數學公式,是很不錯的入門書。目前中文版已經脫銷,對于有志于這個領域的人來說,英文的pdf是個不錯的選擇,因為后面有很多經典書的翻譯都較差,只能看英文版,不如從這個入手。還有,這本書適合于快速看完,因為據評論,看完一些經典的帶有數學推導的書后會發(fā)現這本書什么都沒講,只是舉了很多例子而已。
  •     最近對推薦系統比較感興趣,所以在同時看這本書和《推薦系統實踐》。這本書總的來講相當不錯。但是因為書中的程序都是Python寫的,所以不懂Python的建議找個快速入門的教程看一下,這樣可以事半功倍。推薦《簡明 Python 教程》,地址:http://sebug.net/paper/python/,這個教程最多花你一天的時間,但是看完之后可以對Python有的大體的了解,之后可以更好的看本書的程序。另外,建議實現書中程序時使用Python2.7,不要使用Python3的版本。因為兩個版本有區(qū)別,會給你添很多的麻煩,會讓你浪費時間花在版本差別的,而且后期用到的SQLite數據庫現在還不支持Python3。我覺得應該帶著學習算法思想的目的去看本書,所以不要在版本上花費太多的時間。有網友總結了在實現程序時Python版本不同會存在的問題。網址: http://blog.sciencenet.cn/blog-791354-689554.html。現在剛看完 優(yōu)化 這一章,講的真好。尤其是模擬退火算法和遺傳算法。
      總結一些:這是本好書,如果你對相關的東西感興趣,看了之后絕對不后悔。
  •     讀完這本書,真的很是受益匪淺!作者沒有用一個公式就把數據挖掘領域常用的算法給大家講解清楚了!真的很是受益匪淺!如果你會Python語言就更好了!而且強烈建議大家去讀英文原版,中文翻譯會丟失原著的一些東西!
  •     這是一本很適合對各種機器學習知識進行了解的入門讀物,涵蓋了較為全面的機器學習方法。全書翻譯得不錯,但是到處都是須要,真是需要,須要,傻傻分不清楚啊,看著有點別扭的感覺,不過沒辦法,還是得感謝譯者,這只能怪自己的英文水平太低咯~
  •      剛看了collective intelligence沒多久,里面講解了很多實用的東西。很多例子自己也動手寫了一遍,感覺收獲不少。第四章講搜索引擎。原來上過udacity的公開課,里面cs101也是講用python寫一個搜索引擎,但后者沒有前者敘述的全面。作為了解搜索引擎的原理,基本算法,第四章的講解還是很不錯的。
       第五章講述隨機優(yōu)化。可是在代碼里發(fā)現了不少錯誤,還好在中文版都得到了糾正??磥碜g者是比較仔細的。建議把兩個版本結合來看,英文版用來理解,中文版看代碼。
  •       這本書還不錯的,很適合數學基礎不算太好(當然也還是要一定的數學基礎),又想了解數據挖掘這個領域的讀者?;蛘哂袑嶋H的項目需求,但又沒有足夠的時間去深入了解這個領域的實踐者。
        
        不過我每次看到有人說它把艱澀的數學講的很通俗、進而認為那些寫滿數學公式的書是故弄玄虛這樣的說法時就覺得很反胃口。但這種說法很普遍,不論是在這里還是在Amazon.com。
        
        數學從某種程度上說就是一門語言,能夠讓復雜的概念和關系用嚴謹而簡潔的方式表達出來。就好比有了"操作系統"這樣的專業(yè)術語,你在跟別人交談的時候就不用說"我的軟件是運行在另外一個管理內存、進程、文件等的底層系統之上"這樣羅索而充滿歧義的話一樣。想進入一個新的圈子,就必須懂得這個圈子的語言,這是顯而易見的事情。所以每個領域都有自己的一些專業(yè)術語,而數學的一些分支就是數據挖掘或機器學習這個圈子的語言的重要組成部分。
        
        集體智慧編程這本書能夠讓你在掌握很少的數學知識時,仍然能夠掌握一定的數據挖掘技能。不管是為了應對緊迫的項目壓力,或是培養(yǎng)這個領域的興趣,把它作為入門書,都是一個不錯的選擇。但如果要根據不同的應用設計自己的算法,而不是僅僅拷貝別人的算法,那么掌握數學語言并進行更深入的學習顯然是非常必要的。   這本書還不錯的,很適合數學基礎不算太好(當然也還是要一定的數學基礎),又想了解數據挖掘這個領域的讀者。或者有實際的項目需求,但又沒有足夠的時間去深入了解這個領域的實踐者。
        
        不過我每次看到有人說它把艱澀的數學講的很通俗、進而認為那些寫滿數學公式的書是故弄玄虛這樣的說法時就覺得很反胃口。但這種說法很普遍,不論是在這里還是在Amazon.com。
        
        數學從某種程度上說就是一門語言,能夠讓復雜的概念和關系用嚴謹而簡潔的方式表達出來。就好比有了"操作系統"這樣的專業(yè)術語,你在跟別人交談的時候就不用說"我的軟件是運行在另外一個管理內存、進程、文件等的底層系統之上"這樣羅索而充滿歧義的話一樣。想進入一個新的圈子,就必須懂得這個圈子的語言,這是顯而易見的事情。所以每個領域都有自己的一些專業(yè)術語,而數學的一些分支就是數據挖掘或機器學習這個圈子的語言的重要組成部分。
        
        集體智慧編程這本書能夠讓你在掌握很少的數學知識時,仍然能夠掌握一定的數據挖掘技能。不管是為了應對緊迫的項目壓力,或是培養(yǎng)這個領域的興趣,把它作為入門書,都是一個不錯的選擇。但如果要根據不同的應用設計自己的算法,而不是僅僅拷貝別人的算法,那么掌握數學語言并進行更深入的學習顯然是非常必要的。   這本書還不錯的,很適合數學基礎不算太好(當然也還是要一定的數學基礎),又想了解數據挖掘這個領域的讀者?;蛘哂袑嶋H的項目需求,但又沒有足夠的時間去深入了解這個領域的實踐者。
        
        不過我每次看到有人說它把艱澀的數學講的很通俗、進而認為那些寫滿數學公式的書是故弄玄虛這樣的說法時就覺得很反胃口。但這種說法很普遍,不論是在這里還是在Amazon.com。
        
        數學從某種程度上說就是一門語言,能夠讓復雜的概念和關系用嚴謹而簡潔的方式表達出來。就好比有了"操作系統"這樣的專業(yè)術語,你在跟別人交談的時候就不用說"我的軟件是運行在另外一個管理內存、進程、文件等的底層系統之上"這樣羅索而充滿歧義的話一樣。想進入一個新的圈子,就必須懂得這個圈子的語言,這是顯而易見的事情。所以每個領域都有自己的一些專業(yè)術語,而數學的一些分支就是數據挖掘或機器學習這個圈子的語言的重要組成部分。
        
        集體智慧編程這本書能夠讓你在掌握很少的數學知識時,仍然能夠掌握一定的數據挖掘技能。不管是為了應對緊迫的項目壓力,或是培養(yǎng)這個領域的興趣,把它作為入門書,都是一個不錯的選擇。但如果要根據不同的應用設計自己的算法,而不是僅僅拷貝別人的算法,那么掌握數學語言并進行更深入的學習顯然是非常必要的。   這本書還不錯的,很適合數學基礎不算太好(當然也還是要一定的數學基礎),又想了解數據挖掘這個領域的讀者?;蛘哂袑嶋H的項目需求,但又沒有足夠的時間去深入了解這個領域的實踐者。
        
        不過我每次看到有人說它把艱澀的數學講的很通俗、進而認為那些寫滿數學公式的書是故弄玄虛這樣的說法時就覺得很反胃口。但這種說法很普遍,不論是在這里還是在Amazon.com。
        
        數學從某種程度上說就是一門語言,能夠讓復雜的概念和關系用嚴謹而簡潔的方式表達出來。就好比有了"操作系統"這樣的專業(yè)術語,你在跟別人交談的時候就不用說"我的軟件是運行在另外一個管理內存、進程、文件等的底層系統之上"這樣羅索而充滿歧義的話一樣。想進入一個新的圈子,就必須懂得這個圈子的語言,這是顯而易見的事情。所以每個領域都有自己的一些專業(yè)術語,而數學的一些分支就是數據挖掘或機器學習這個圈子的語言的重要組成部分。
        
        集體智慧編程這本書能夠讓你在掌握很少的數學知識時,仍然能夠掌握一定的數據挖掘技能。不管是為了應對緊迫的項目壓力,或是培養(yǎng)這個領域的興趣,把它作為入門書,都是一個不錯的選擇。但如果要根據不同的應用設計自己的算法,而不是僅僅拷貝別人的算法,那么掌握數學語言并進行更深入的學習顯然是非常必要的。   這本書還不錯的,很適合數學基礎不算太好(當然也還是要一定的數學基礎),又想了解數據挖掘這個領域的讀者?;蛘哂袑嶋H的項目需求,但又沒有足夠的時間去深入了解這個領域的實踐者。
        
        不過我每次看到有人說它把艱澀的數學講的很通俗、進而認為那些寫滿數學公式的書是故弄玄虛這樣的說法時就覺得很反胃口。但這種說法很普遍,不論是在這里還是在Amazon.com。
        
        數學從某種程度上說就是一門語言,能夠讓復雜的概念和關系用嚴謹而簡潔的方式表達出來。就好比有了"操作系統"這樣的專業(yè)術語,你在跟別人交談的時候就不用說"我的軟件是運行在另外一個管理內存、進程、文件等的底層系統之上"這樣羅索而充滿歧義的話一樣。想進入一個新的圈子,就必須懂得這個圈子的語言,這是顯而易見的事情。所以每個領域都有自己的一些專業(yè)術語,而數學的一些分支就是數據挖掘或機器學習這個圈子的語言的重要組成部分。
        
        集體智慧編程這本書能夠讓你在掌握很少的數學知識時,仍然能夠掌握一定的數據挖掘技能。不管是為了應對緊迫的項目壓力,或是培養(yǎng)這個領域的興趣,把它作為入門書,都是一個不錯的選擇。但如果要根據不同的應用設計自己的算法,而不是僅僅拷貝別人的算法,那么掌握數學語言并進行更深入的學習顯然是非常必要的。   這本書還不錯的,很適合數學基礎不算太好(當然也還是要一定的數學基礎),又想了解數據挖掘這個領域的讀者?;蛘哂袑嶋H的項目需求,但又沒有足夠的時間去深入了解這個領域的實踐者。
        
        不過我每次看到有人說它把艱澀的數學講的很通俗、進而認為那些寫滿數學公式的書是故弄玄虛這樣的說法時就覺得很反胃口。但這種說法很普遍,不論是在這里還是在Amazon.com。
        
        數學從某種程度上說就是一門語言,能夠讓復雜的概念和關系用嚴謹而簡潔的方式表達出來。就好比有了"操作系統"這樣的專業(yè)術語,你在跟別人交談的時候就不用說"我的軟件是運行在另外一個管理內存、進程、文件等的底層系統之上"這樣羅索而充滿歧義的話一樣。想進入一個新的圈子,就必須懂得這個圈子的語言,這是顯而易見的事情。所以每個領域都有自己的一些專業(yè)術語,而數學的一些分支就是數據挖掘或機器學習這個圈子的語言的重要組成部分。
        
        集體智慧編程這本書能夠讓你在掌握很少的數學知識時,仍然能夠掌握一定的數據挖掘技能。不管是為了應對緊迫的項目壓力,或是培養(yǎng)這個領域的興趣,把它作為入門書,都是一個不錯的選擇。但如果要根據不同的應用設計自己的算法,而不是僅僅拷貝別人的算法,那么掌握數學語言并進行更深入的學習顯然是非常必要的。   這本書還不錯的,很適合數學基礎不算太好(當然也還是要一定的數學基礎),又想了解數據挖掘這個領域的讀者?;蛘哂袑嶋H的項目需求,但又沒有足夠的時間去深入了解這個領域的實踐者。
        
        不過我每次看到有人說它把艱澀的數學講的很通俗、進而認為那些寫滿數學公式的書是故弄玄虛這樣的說法時就覺得很反胃口。但這種說法很普遍,不論是在這里還是在Amazon.com。
        
        數學從某種程度上說就是一門語言,能夠讓復雜的概念和關系用嚴謹而簡潔的方式表達出來。就好比有了"操作系統"這樣的專業(yè)術語,你在跟別人交談的時候就不用說"我的軟件是運行在另外一個管理內存、進程、文件等的底層系統之上"這樣羅索而充滿歧義的話一樣。想進入一個新的圈子,就必須懂得這個圈子的語言,這是顯而易見的事情。所以每個領域都有自己的一些專業(yè)術語,而數學的一些分支就是數據挖掘或機器學習這個圈子的語言的重要組成部分。
        
        集體智慧編程這本書能夠讓你在掌握很少的數學知識時,仍然能夠掌握一定的數據挖掘技能。不管是為了應對緊迫的項目壓力,或是培養(yǎng)這個領域的興趣,把它作為入門書,都是一個不錯的選擇。但如果要根據不同的應用設計自己的算法,而不是僅僅拷貝別人的算法,那么掌握數學語言并進行更深入的學習顯然是非常必要的。   這本書還不錯的,很適合數學基礎不算太好(當然也還是要一定的數學基礎),又想了解數據挖掘這個領域的讀者。或者有實際的項目需求,但又沒有足夠的時間去深入了解這個領域的實踐者。
        
        不過我每次看到有人說它把艱澀的數學講的很通俗、進而認為那些寫滿數學公式的書是故弄玄虛這樣的說法時就覺得很反胃口。但這種說法很普遍,不論是在這里還是在Amazon.com。
        
        數學從某種程度上說就是一門語言,能夠讓復雜的概念和關系用嚴謹而簡潔的方式表達出來。就好比有了"操作系統"這樣的專業(yè)術語,你在跟別人交談的時候就不用說"我的軟件是運行在另外一個管理內存、進程、文件等的底層系統之上"這樣羅索而充滿歧義的話一樣。想進入一個新的圈子,就必須懂得這個圈子的語言,這是顯而易見的事情。所以每個領域都有自己的一些專業(yè)術語,而數學的一些分支就是數據挖掘或機器學習這個圈子的語言的重要組成部分。
        
        集體智慧編程這本書能夠讓你在掌握很少的數學知識時,仍然能夠掌握一定的數據挖掘技能。不管是為了應對緊迫的項目壓力,或是培養(yǎng)這個領域的興趣,把它作為入門書,都是一個不錯的選擇。但如果要根據不同的應用設計自己的算法,而不是僅僅拷貝別人的算法,那么掌握數學語言并進行更深入的學習顯然是非常必要的。   這本書還不錯的,很適合數學基礎不算太好(當然也還是要一定的數學基礎),又想了解數據挖掘這個領域的讀者?;蛘哂袑嶋H的項目需求,但又沒有足夠的時間去深入了解這個領域的實踐者。
        
        不過我每次看到有人說它把艱澀的數學講的很通俗、進而認為那些寫滿數學公式的書是故弄玄虛這樣的說法時就覺得很反胃口。但這種說法很普遍,不論是在這里還是在Amazon.com。
        
        數學從某種程度上說就是一門語言,能夠讓復雜的概念和關系用嚴謹而簡潔的方式表達出來。就好比有了"操作系統"這樣的專業(yè)術語,你在跟別人交談的時候就不用說"我的軟件是運行在另外一個管理內存、進程、文件等的底層系統之上"這樣羅索而充滿歧義的話一樣。想進入一個新的圈子,就必須懂得這個圈子的語言,這是顯而易見的事情。所以每個領域都有自己的一些專業(yè)術語,而數學的一些分支就是數據挖掘或機器學習這個圈子的語言的重要組成部分。
        
        集體智慧編程這本書能夠讓你在掌握很少的數學知識時,仍然能夠掌握一定的數據挖掘技能。不管是為了應對緊迫的項目壓力,或是培養(yǎng)這個領域的興趣,把它作為入門書,都是一個不錯的選擇。但如果要根據不同的應用設計自己的算法,而不是僅僅拷貝別人的算法,那么掌握數學語言并進行更深入的學習顯然是非常必要的。   這本書還不錯的,很適合數學基礎不算太好(當然也還是要一定的數學基礎),又想了解數據挖掘這個領域的讀者?;蛘哂袑嶋H的項目需求,但又沒有足夠的時間去深入了解這個領域的實踐者。
        
        不過我每次看到有人說它把艱澀的數學講的很通俗、進而認為那些寫滿數學公式的書是故弄玄虛這樣的說法時就覺得很反胃口。但這種說法很普遍,不論是在這里還是在Amazon.com。
        
        數學從某種程度上說就是一門語言,能夠讓復雜的概念和關系用嚴謹而簡潔的方式表達出來。就好比有了"操作系統"這樣的專業(yè)術語,你在跟別人交談的時候就不用說"我的軟件是運行在另外一個管理內存、進程、文件等的底層系統之上"這樣羅索而充滿歧義的話一樣。想進入一個新的圈子,就必須懂得這個圈子的語言,這是顯而易見的事情。所以每個領域都有自己的一些專業(yè)術語,而數學的一些分支就是數據挖掘或機器學習這個圈子的語言的重要組成部分。
        
        集體智慧編程這本書能夠讓你在掌握很少的數學知識時,仍然能夠掌握一定的數據挖掘技能。不管是為了應對緊迫的項目壓力,或是培養(yǎng)這個領域的興趣,把它作為入門書,都是一個不錯的選擇。但如果要根據不同的應用設計自己的算法,而不是僅僅拷貝別人的算法,那么掌握數學語言并進行更深入的學習顯然是非常必要的。   這本書還不錯的,很適合數學基礎不算太好(當然也還是要一定的數學基礎),又想了解數據挖掘這個領域的讀者?;蛘哂袑嶋H的項目需求,但又沒有足夠的時間去深入了解這個領域的實踐者。
        
        不過我每次看到有人說它把艱澀的數學講的很通俗、進而認為那些寫滿數學公式的書是故弄玄虛這樣的說法時就覺得很反胃口。但這種說法很普遍,不論是在這里還是在Amazon.com。
        
        數學從某種程度上說就是一門語言,能夠讓復雜的概念和關系用嚴謹而簡潔的方式表達出來。就好比有了"操作系統"這樣的專業(yè)術語,你在跟別人交談的時候就不用說"我的軟件是運行在另外一個管理內存、進程、文件等的底層系統之上"這樣羅索而充滿歧義的話一樣。想進入一個新的圈子,就必須懂得這個圈子的語言,這是顯而易見的事情。所以每個領域都有自己的一些專業(yè)術語,而數學的一些分支就是數據挖掘或機器學習這個圈子的語言的重要組成部分。
        
        集體智慧編程這本書能夠讓你在掌握很少的數學知識時,仍然能夠掌握一定的數據挖掘技能。不管是為了應對緊迫的項目壓力,或是培養(yǎng)這個領域的興趣,把它作為入門書,都是一個不錯的選擇。但如果要根據不同的應用設計自己的算法,而不是僅僅拷貝別人的算法,那么掌握數學語言并進行更深入的學習顯然是非常必要的。   這本書還不錯的,很適合數學基礎不算太好(當然也還是要一定的數學基礎),又想了解數據挖掘這個領域的讀者。或者有實際的項目需求,但又沒有足夠的時間去深入了解這個領域的實踐者。
        
        不過我每次看到有人說它把艱澀的數學講的很通俗、進而認為那些寫滿數學公式的書是故弄玄虛這樣的說法時就覺得很反胃口。但這種說法很普遍,不論是在這里還是在Amazon.com。
        
        數學從某種程度上說就是一門語言,能夠讓復雜的概念和關系用嚴謹而簡潔的方式表達出來。就好比有了"操作系統"這樣的專業(yè)術語,你在跟別人交談的時候就不用說"我的軟件是運行在另外一個管理內存、進程、文件等的底層系統之上"這樣羅索而充滿歧義的話一樣。想進入一個新的圈子,就必須懂得這個圈子的語言,這是顯而易見的事情。所以每個領域都有自己的一些專業(yè)術語,而數學的一些分支就是數據挖掘或機器學習這個圈子的語言的重要組成部分。
        
        集體智慧編程這本書能夠讓你在掌握很少的數學知識時,仍然能夠掌握一定的數據挖掘技能。不管是為了應對緊迫的項目壓力,或是培養(yǎng)這個領域的興趣,把它作為入門書,都是一個不錯的選擇。但如果要根據不同的應用設計自己的算法,而不是僅僅拷貝別人的算法,那么掌握數學語言并進行更深入的學習顯然是非常必要的。   這本書還不錯的,很適合數學基礎不算太好(當然也還是要一定的數學基礎),又想了解數據挖掘這個領域的讀者?;蛘哂袑嶋H的項目需求,但又沒有足夠的時間去深入了解這個領域的實踐者。
        
        不過我每次看到有人說它把艱澀的數學講的很通俗、進而認為那些寫滿數學公式的書是故弄玄虛這樣的說法時就覺得很反胃口。但這種說法很普遍,不論是在這里還是在Amazon.com。
        
        數學從某種程度上說就是一門語言,能夠讓復雜的概念和關系用嚴謹而簡潔的方式表達出來。就好比有了"操作系統"這樣的專業(yè)術語,你在跟別人交談的時候就不用說"我的軟件是運行在另外一個管理內存、進程、文件等的底層系統之上"這樣羅索而充滿歧義的話一樣。想進入一個新的圈子,就必須懂得這個圈子的語言,這是顯而易見的事情。所以每個領域都有自己的一些專業(yè)術語,而數學的一些分支就是數據挖掘或機器學習這個圈子的語言的重要組成部分。
        
        集體智慧編程這本書能夠讓你在掌握很少的數學知識時,仍然能夠掌握一定的數據挖掘技能。不管是為了應對緊迫的項目壓力,或是培養(yǎng)這個領域的興趣,把它作為入門書,都是一個不錯的選擇。但如果要根據不同的應用設計自己的算法,而不是僅僅拷貝別人的算法,那么掌握數學語言并進行更深入的學習顯然是非常必要的。   這本書還不錯的,很適合數學基礎不算太好(當然也還是要一定的數學基礎),又想了解數據挖掘這個領域的讀者?;蛘哂袑嶋H的項目需求,但又沒有足夠的時間去深入了解這個領域的實踐者。
        
        不過我每次看到有人說它把艱澀的數學講的很通俗、進而認為那些寫滿數學公式的書是故弄玄虛這樣的說法時就覺得很反胃口。但這種說法很普遍,不論是在這里還是在Amazon.com。
        
        數學從某種程度上說就是一門語言,能夠讓復雜的概念和關系用嚴謹而簡潔的方式表達出來。就好比有了"操作系統"這樣的專業(yè)術語,你在跟別人交談的時候就不用說"我的軟件是運行在另外一個管理內存、進程、文件等的底層系統之上"這樣羅索而充滿歧義的話一樣。想進入一個新的圈子,就必須懂得這個圈子的語言,這是顯而易見的事情。所以每個領域都有自己的一些專業(yè)術語,而數學的一些分支就是數據挖掘或機器學習這個圈子的語言的重要組成部分。
        
        集體智慧編程這本書能夠讓你在掌握很少的數學知識時,仍然能夠掌握一定的數據挖掘技能。不管是為了應對緊迫的項目壓力,或是培養(yǎng)這個領域的興趣,把它作為入門書,都是一個不錯的選擇。但如果要根據不同的應用設計自己的算法,而不是僅僅拷貝別人的算法,那么掌握數學語言并進行更深入的學習顯然是非常必要的。   這本書還不錯的,很適合數學基礎不算太好(當然也還是要一定的數學基礎),又想了解數據挖掘這個領域的讀者?;蛘哂袑嶋H的項目需求,但又沒有足夠的時間去深入了解這個領域的實踐者。
        
        不過我每次看到有人說它把艱澀的數學講的很通俗、進而認為那些寫滿數學公式的書是故弄玄虛這樣的說法時就覺得很反胃口。但這種說法很普遍,不論是在這里還是在Amazon.com。
        
        數學從某種程度上說就是一門語言,能夠讓復雜的概念和關系用嚴謹而簡潔的方式表達出來。就好比有了"操作系統"這樣的專業(yè)術語,你在跟別人交談的時候就不用說"我的軟件是運行在另外一個管理內存、進程、文件等的底層系統之上"這樣羅索而充滿歧義的話一樣。想進入一個新的圈子,就必須懂得這個圈子的語言,這是顯而易見的事情。所以每個領域都有自己的一些專業(yè)術語,而數學的一些分支就是數據挖掘或機器學習這個圈子的語言的重要組成部分。
        
        集體智慧編程這本書能夠讓你在掌握很少的數學知識時,仍然能夠掌握一定的數據挖掘技能。不管是為了應對緊迫的項目壓力,或是培養(yǎng)這個領域的興趣,把它作為入門書,都是一個不錯的選擇。但如果要根據不同的應用設計自己的算法,而不是僅僅拷貝別人的算法,那么掌握數學語言并進行更深入的學習顯然是非常必要的。   這本書還不錯的,很適合數學基礎不算太好(當然也還是要一定的數學基礎),又想了解數據挖掘這個領域的讀者?;蛘哂袑嶋H的項目需求,但又沒有足夠的時間去深入了解這個領域的實踐者。
        
        不過我每次看到有人說它把艱澀的數學講的很通俗、進而認為那些寫滿數學公式的書是故弄玄虛這樣的說法時就覺得很反胃口。但這種說法很普遍,不論是在這里還是在Amazon.com。
        
        數學從某種程度上說就是一門語言,能夠讓復雜的概念和關系用嚴謹而簡潔的方式表達出來。就好比有了"操作系統"這樣的專業(yè)術語,你在跟別人交談的時候就不用說"我的軟件是運行在另外一個管理內存、進程、文件等的底層系統之上"這樣羅索而充滿歧義的話一樣。想進入一個新的圈子,就必須懂得這個圈子的語言,這是顯而易見的事情。所以每個領域都有自己的一些專業(yè)術語,而數學的一些分支就是數據挖掘或機器學習這個圈子的語言的重要組成部分。
        
        集體智慧編程這本書能夠讓你在掌握很少的數學知識時,仍然能夠掌握一定的數據挖掘技能。不管是為了應對緊迫的項目壓力,或是培養(yǎng)這個領域的興趣,把它作為入門書,都是一個不錯的選擇。但如果要根據不同的應用設計自己的算法,而不是僅僅拷貝別人的算法,那么掌握數學語言并進行更深入的學習顯然是非常必要的。   這本書還不錯的,很適合數學基礎不算太好(當然也還是要一定的數學基礎),又想了解數據挖掘這個領域的讀者?;蛘哂袑嶋H的項目需求,但又沒有足夠的時間去深入了解這個領域的實踐者。
        
        不過我每次看到有人說它把艱澀的數學講的很通俗、進而認為那些寫滿數學公式的書是故弄玄虛這樣的說法時就覺得很反胃口。但這種說法很普遍,不論是在這里還是在Amazon.com。
        
        數學從某種程度上說就是一門語言,能夠讓復雜的概念和關系用嚴謹而簡潔的方式表達出來。就好比有了"操作系統"這樣的專業(yè)術語,你在跟別人交談的時候就不用說"我的軟件是運行在另外一個管理內存、進程、文件等的底層系統之上"這樣羅索而充滿歧義的話一樣。想進入一個新的圈子,就必須懂得這個圈子的語言,這是顯而易見的事情。所以每個領域都有自己的一些專業(yè)術語,而數學的一些分支就是數據挖掘或機器學習這個圈子的語言的重要組成部分。
        
        集體智慧編程這本書能夠讓你在掌握很少的數學知識時,仍然能夠掌握一定的數據挖掘技能。不管是為了應對緊迫的項目壓力,或是培養(yǎng)這個領域的興趣,把它作為入門書,都是一個不錯的選擇。但如果要根據不同的應用設計自己的算法,而不是僅僅拷貝別人的算法,那么掌握數學語言并進行更深入的學習顯然是非常必要的。
  •     記得第一次讀這本書的時候,是剛畢業(yè)在第一家小公司工作,雖然當時只是做Web,但是作為十人團隊中少有的還有那么點數學基礎的人,無可避免地把一些簡單的非工程化的東西接了過來。當時有一個小任務是來做喜歡xxx的人也喜歡xxx,老大就把這本集體智慧編程扔給了我,說看這本書,然后看看能不能把這個做出來,當時我還不知道這門“蹩腳”的語言叫做Python,不過感謝有了這本書,我知道了什么叫Item-based,雖然之后又忘記了。接下來我便順著半懂不懂地讀完了這本書,“知道”了SVM,"知道"了協同過濾,然后便自認為懂了算法。以至于在今后的幾年,每當有人希望學習下數據挖掘,我便向他們推薦這本書。
      
      再到幾年后,我自己真的置身到了算法領域。前幾天看PRML看到SVM的知識,看的有些迷迷糊糊,于是便回頭翻了一下許久不動的《集體智慧編程》,我做的是從第一頁開始不停地往后翻,發(fā)現對我理解算法幾乎沒有任何的幫助,因為發(fā)現這本書其實什么都沒有講。
      
      回到說這本書本身,其實這本書最大的優(yōu)勢便是書中沒有理論推導,沒有復雜的數學公式,例如在講SVM的時候,他講到的我們做SVM的目的就是要需要找到超平面,至于非線性可分的數據來說,我們需要的是把低維數據升至高維,然后便可線性可分了,而對照PRML這種把SVM講了整整三四章的書來說,知識之淺顯就可見一斑了;甚至不用和PRML來比較,就算是對比斯坦福的機器學習公開課來說,其深入程度都不如一堂課的內容了。
      
      這本書在我看來適合的三個人群:A. 剛剛具有基礎編程知識的學生 B. 如我剛畢業(yè)的情況,不是希望進入數據挖掘領域,只是要急著做完一個項目 C. 大多數的產品經理。
      
      最后說數學公式,大多數人對這本書的贊譽莫過于本書沒有復雜難懂的數學公式,Talk is cheap , Show me the code,是被很多程序員尊為“圣經”的一句話,其實對于數據挖掘理論恰恰卻是Code is cheap , Show me the method。然后數學作為一種奇妙的語言,可以把很多晦澀的理論通過一些巧妙的數學符號給表示出來,而代碼往往做的是把這些優(yōu)美的數學公式用if , for給打亂。正如我之前一次所說,把數學公式反映成代碼非常簡單,但是把代碼給還原成數學公式簡直就是讓人抓狂的事情。所以我以前嘗試過一個系列,叫做“白話數據挖掘”,里面希望不用一個數學公式把我理解的數據挖掘算法講給所有人聽,但是后來發(fā)現這個事情是不現實的,因為代碼比公式要難懂,冗余的多。
      
      另外,作為算法工程師,如果只是會盲從地遵從paper去套用他人的算法,而沒辦法對其算法進行一個從頭至尾的理解,這個學術上的算法往往也是無法應用于工程化實踐的。
      
      所以,如果你真的熱愛數據挖掘,熱愛算法領域,集體智慧編程可以成為你的第一本書,但是不要花費太多的時間,把更多的時間留給數學,留給那些每篇都有著“晦澀”的數學公式的大塊頭把。
  •      這本書很好 ,可惜 正版的沒了。
       第二章的 算法,很簡單,想明白了 就是四個步驟,照做 一個算法就出來了。 厲害
      然后 該書 還提供了 搜索、 個性算法等很多模塊的算法,都很簡單,但是清晰 實用。我朋友說,照著這個開發(fā)就可以
      
      缺點是 python 這個語言不是很通用,現在主要是php .net JAVa等, 不過大數據的 處理 技術 好像用python比較多
      
      不過該書主要講思路,邏輯設計,所以 一樣有用
  •     集體智慧,很容易被誤導,實際上指的是根據大量群體的行為來推測或預測其他個體的行為,正如一只蜜蜂沒有智慧,而一大群蜜蜂卻分工合作,井井有條,在計算機科學中,采用集體智慧的思想可以說是另一條實現人工智能的途徑,其在聚類,推薦,分類等中都有非常大的應用!本書并沒有非常詳細的介紹每種算法那,只是對這些算法的主要思想和方法作了一些介紹,對于入門學習者很有幫助,今年python語言很火,其編程非常的方便,本書采用的就是python來實現的這些算法,目前開源社區(qū)有很多python的庫,有些非常的出色,可以拿過來直接用,用這些庫,然后自己再編寫些程序可以構造出非常出色的程序。其編程簡單,用于人工智能是一件非常合適的編程工具。
  •     第一次完整的讀完了英文版的教材,深入淺出,聯系實踐,跟著敲了大部分的代碼。應該找時間再讀一遍,并整理讀書筆記。自己水平有限,只能看懂算法,還不能理解其中的根本思想。
  •     一本非常不錯的好書!確實是非常不錯的!一本非常不錯的好書!確實是非常不錯的!一本非常不錯的好書!確實是非常不錯的!一本非常不錯的好書!確實是非常不錯的!一本非常不錯的好書!確實是非常不錯的!一本非常不錯的好書!確實是非常不錯的!一本非常不錯的好書!確實是非常不錯的!一本非常不錯的好書!確實是非常不錯的!一本非常不錯的好書!確實是非常不錯的!一本非常不錯的好書!確實是非常不錯的!一本非常不錯的好書!確實是非常不錯的!一本非常不錯的好書!確實是非常不錯的!一本非常不錯的好書!確實是非常不錯的!
  •     這是我唯一一本可以堅持讀下去的機器學習/模式識別的書,能把復雜問題給你通俗的講解,而不是給你大堆大堆的公式,很同意其他讀者的觀點:著者一定是絕頂高人,另外他還有幾本書《數據之美》《Programming the Semantic Web 》值得一看
  •     如果你從沒接觸過挖掘,推薦,搜索引擎的書,確實值得一讀。
      如果你懂python,那就更好了,還可以練練手。
      不過理論上也沒有太多的深入,比如搜索引擎一塊,基本就是個小例子,前沿的東西是沒有的,畢竟篇幅有限。
  •     這本書當做導論來看才比較適合。里面理論性的實在是很淺,價值大多都體現在實現上。
      
      搞過數學建模的同學看到此書肯定特別親切,好多理論都接觸過,不少內容還用MATLAB實現過,而且還比書里邊的研究得更為深入。
      
      因此該書的意義絕不是在于對某某算法的深入研究。而是告訴你,在工程領域的具體實現上應該運用哪類算法。權當更新知識地圖了,這也正是導論書籍作用所在。
      
      至于到實際需要寫代碼實現的時候,還是針對性的看看相關論文為宜。聚類的幾個參數不搞透徹,那效果還不如肉眼看呢。
  •       為了更好地學習本書,我從學習python開始到后來調試書中的網站實例?;瞬簧俟Ψ颍M笥褌儾灰邚澛?。這里提供了圖文并茂的指導過程。請參考:
        http://blog.csdn.net/zjmwqx/article/details/7007438
  •     為了更好地學習本書,我從學習python開始到后來調試書中的網站實例?;瞬簧俟Ψ颍M笥褌儾灰邚澛?。這里提供了圖文并茂的指導過程。請參考:
      http://blog.csdn.net/zjmwqx/article/details/7007438
  •     在前頭那些來自業(yè)界的贊譽,還是沒有夸大的。
      這個領域也就這么些話題,而這本書的確把這些話題一個個整理出來,并評價他們的應用場景和優(yōu)缺點。我不知道閱讀此書前沒看過學院派書籍的人感覺如何,要是我一上手看這書,也只是知其然不知其所以然的程度。
      這本書的示例代碼用python,也是挺討巧的,python的代碼可讀性很強,尤其那些涉及數據結構的運算,很多一行就搞定了。配合的注釋也很清晰,每個代碼后還會再用一定篇幅闡明代碼是干什么的。而源代碼在網上也能輕松獲得,對于想躍躍欲試開發(fā)的朋友也是不錯的起步。
      我原以為他會揭露一些商用系統的算法細節(jié),結果只是從商用系統的API去獲得數據而已。
      總之,這是一本適合機器學習方向的入門好書,能從這本書中一窺當今這方面熱門的話題,若是我早些讀到的話,或許自己的研究方向也會不同吧。
  •       的確是本實用,有深度,又淺顯易懂的書。能夠把復雜的問題寫得如此簡單的人肯定是位絕頂高手。特別是原來感覺比較深奧的問題,比如:
      核方法(Kernal Trick)、模擬退火(Simulated Annealing)等這些困擾多年的問題。想當年為了弄清SVM的核方法,看了不少參考資料,有的厚厚的像塊磚。幾次一頭扎進水想弄明白,結果每次都因營養(yǎng)不足被迫浮出水面。當時感覺這東西好難。讀完后,以前糾結的問題,忽然就明白了。原來是這樣!
  •     Want to tap the power behind search rankings, product recommendations, social bookmarking, and online matchmaking? This fascinating book demonstrates how you can build Web 2.0 applications to mine the enormous amount of data created by people on the Internet. With the sophisticated algorithms in this book, you can write smart programs to access interesting datasets from other web sites, collect data from users of your own applications, and analyze and understand the data once you've found it. Programming Collective Intelligence takes you into the world of machine learning and statistics, and explains how to draw conclusions about user experience, marketing, personal tastes, and human behavior in general -- all from information that you and others collect every day. Each algorithm is described clearly and concisely with code that can immediately be used on your web site, blog, Wiki, or specialized application. This book explains: Collaborative filtering techniques that enable online retailers to recommend products or media Methods of clustering to detect groups of similar items in a large dataset Search engine features -- crawlers, indexers, query engines, and the PageRank algorithm Optimization algorithms that search millions of possible solutions to a problem and choose the best one Bayesian filtering, used in spam filters for classifying documents based on word types and other features Using decision trees not only to make predictions, but to model the way decisions are made Predicting numerical values rather than classifications to build price models Support vector machines to match people in online dating sites Non-negative matrix factorization to find the independent features in adataset Evolving intelligence for problem solving -- how a computer develops its skill by improving its own code the more it plays a game Each chapter includes exercises for extending the algorithms to make them more powerful. Go beyond simple database-backed applications and put the wealth of Internet data to work for you. "Bravo I cannot think of a better way for a developer to first learn these algorithms and methods, nor can I think of a better way for me (an old AI dog) to reinvigorate my knowledge of the details." -- Dan Russell, Google "Toby's book does a great job of breaking down the complex subject matter of machine-learning algorithms into practical, easy-to-understand examples that can be directly applied to analysis of social interaction across the Web today. If I had this book two years ago, it would have saved precious time going down some fruitless paths." -- Tim Wolters, CTO, Collective Intellect
  •     推薦對數據挖掘想入門的同學閱讀,這本書沒有大篇幅讓人頭暈的數學推導,適合想邊學理論邊實踐的人閱讀,如果能把每章最后的習題進行實踐,相信會更有收獲
  •      本書介紹了人工智能(機器學習與數據挖掘為主)在編程(特別是網絡編程)方面的具體應用,介紹了許多機器學習與數據挖掘的算法與實現,幾乎每個算法都是結合著實例來說的,因此能讓讀者有很感性的認識,并且沒有復雜的數學推導,比較適合入門者,要想讀懂本書的算法,唯一的要求就是懂python,如果不懂就沒有辦法精通本書,尤其是初學者,很多原理與實現的詳解都是用python語言來表達的。
  •       獵兔搜索從事企業(yè)搜索,自然語言處理等軟件開發(fā)。產品包括多種語言的自然語言處理和搜索系統,網站搜索和垂直搜索軟件,網絡信息監(jiān)測軟件等。服務于農業(yè)信息化,競爭情報分析等領域。
        
        崗位要求:
        
        1.熟悉數據結構及其實現;
        2.熟悉Java或c#;
        3.數學基礎較好。
        
        開發(fā)工作:
        中文分詞、文本分類、爬蟲等。
        
        工作地點:北京或濟南任選。
        
        網站:http://www.lietu.com
        
        聯系方式:
        email: luogang@gmail.com
        msn:lgjut@sina.com
        QQ:270954928
  •     這本書還不錯的,很適合數學基礎不算太好(當然也還是要一定的數學基礎),又想了解數據挖掘這個領域的讀者?;蛘哂袑嶋H的項目需求,但又沒有足夠的時間去深入了解這個領域的實踐者。
      
      不過我每次看到有人說它把艱澀的數學講的很通俗、進而認為那些寫滿數學公式的書是故弄玄虛這樣的說法時就覺得很反胃口。但這種說法很普遍,不論是在這里還是在Amazon.com。
      
      數學從某種程度上說就是一門語言,能夠讓復雜的概念和關系用嚴謹而簡潔的方式表達出來。就好比有了"操作系統"這樣的專業(yè)術語,你在跟別人交談的時候就不用說"我的軟件是運行在另外一個管理內存、進程、文件等的底層系統之上"這樣羅索而充滿歧義的話一樣。想進入一個新的圈子,就必須懂得這個圈子的語言,這是顯而易見的事情。所以每個領域都有自己的一些專業(yè)術語,而數學的一些分支就是數據挖掘或機器學習這個圈子的語言的重要組成部分。
      
      集體智慧編程這本書能夠讓你在掌握很少的數學知識時,仍然能夠掌握一定的數據挖掘技能。不管是為了應對緊迫的項目壓力,或是培養(yǎng)這個領域的興趣,把它作為入門書,都是一個不錯的選擇。但如果要根據不同的應用設計自己的算法,而不是僅僅拷貝別人的算法,那么掌握數學語言并進行更深入的學習顯然是非常必要的。
      
      
  •     作者把復雜的東西講的我這么平凡的讀者都可以讀懂,并產生了極大的興趣。是在是佩服。
      有點遺憾的是 每章后的習題 沒有答案,哪位朋友有答案,或者都能很簡單的完成的,希望寫出來放在網上,共大家參考。
      雖然我不是搞 c端的,目前用處不大,但對于信息大爆炸的時代來說
      遲早會用上的
  •   請問你讀的是中文版的嗎?現在網上買不到啊
  •   @山桃
    是中文版,我從圖書館借的。網上好像有電子版,真不行打印出來看唄。
  •   我也是之前大概看了下《推薦系統實踐》對CF算法有所了解,正準備看這本呢。
  •   把更多的時間留給數學,留給那些每篇都有著“晦澀”的數學公式的大塊頭把。
  •   說的挺好,非常認同:代碼比公式要難懂,冗余的多,尤其在數據挖掘領域。
  •   非常贊同!
    本科快畢業(yè),想往數據挖掘方向發(fā)展(本已考上研,覺得還是實踐出真知,準備工作了)
    希望多認識數據大牛們,QQ1589243265,可以加下嗎?
  •   大塊頭完全不敢看
  •   這本書網上沒得賣了啊,上哪兒買呢
  •   果然是站在更高的高度呀。這本書應當是個Get feeling of mining method的好書,但確實僅限于入門。
  •   感覺lz有點裝,本來不同的書就有不同的定位。不能說你學了高等數學,就否認小學數學課本的價值。
  •   ls真無聊,我完全否定這本書的價值了么?我最后一段寫的明晃晃吧:如果你真的熱愛數據挖掘,熱愛算法領域,集體智慧編程可以成為你的第一本書,但是不要花費太多的時間
  •   難得的好書,對于數據挖掘很有用
  •   求推薦其他類似好書
  •   jimin 繼續(xù)哦,你的讀書筆記寫的很好!
  •   標記一下,牛人啊
  •   贊樓主!
  •   我比較認同,數學即是業(yè)內人士溝通的統一標準與語言的說法,就好比飛機的設計符合一定的標準,不同的部件才能對接,各類的技術文檔與書籍才能方便地傳輸思想。
    但數據挖掘是一個普及面很廣的領域,不單研究人員,專業(yè)人士在用,在研究。還有大量對數學興趣不大的程序員在用或者想用。也許只是想實現一個簡單的功能,而并不需要深入細究與改進。對于這個規(guī)模其實很大的人群以及這樣簡單的應用目的,我覺得這樣的書是很有價值的。更何況,美國人似乎比中國人更不喜歡數學:),所以寫這樣的書的通常也是美國人。這樣的書拿回來與國內一些滿篇數學公式的“編著”相比,讓國人愛不釋卷也是合乎情理的。
  •   Why?
  •   依據"沒有免費的午餐"原理, 沒有哪個方法會在所有情況下都最優(yōu),Bayesian方法也不例外。但bayesian方法的確能容納更豐富的先驗知識,從這個角度看bayesian方法的確有他的優(yōu)勢。這個在一些"No Free Lunch"方面的文章里有論述。
  •   是啊,所以說沒有哪個方法會在所有情況下都最優(yōu),Bayesian方法也不例外。
  •   俺是外行,最近關注這個領域,說得不對請批評
    要想這些算法能在實際項目中使用,最起碼要突破產品經理這個層面,數學好,理解用戶需求的產品經理有多少?
    比如新浪的微博運營,讓陳彤理解推薦合適的人或者信息給用戶容易,但是讓陳彤理解矩陣和圖論,這事就麻煩點了。也許這個例子舉的不好,貌似陳彤是學機械控制的,數學正好是長項也說不定,哈哈
  •   這個話題就比較復雜了。大多數技術都能從一定程度上讓普通人聽得懂,另一方面,大多數技術即使技術人員也要費很大功夫才能真正弄明白。如果老板是技術出身,那么和技術人員溝通就少了一項障礙。但是技術顯然并不是唯一可能影響溝通的障礙。
    溝通永遠都是最重要而又最具挑戰(zhàn)性的工作。
  •   贊樓上最后一句,“溝通永遠都是最重要而又最具挑戰(zhàn)性的工作?!?/li>
  •   呵呵,可能因為溝通能力不足才有這種感覺,會溝通的人會不會覺得這個很輕松啊
  •   我贊你最后一句,是因為只有這個我能插上一句,其他我都不懂。 掩飾而已!
  •   這句話又掩飾了溝通能力不足
    呵呵
  •   Amazon.com上是美國人寫的review吧。這個math phobia早就已經成了美國大眾文化的一部分了。。。。任何時候數學少就等于好,數學多就等于艱澀難懂。搞得想找本對得起作者數學水平的書,有時還真是困難。沒辦法,那些作者也是被嚇得~
  •   當年美國高校懸賞經濟教材,獲獎的曼昆就是因為通俗易懂。經濟學領域的大拿們有靠一堆數學公式與人溝通的,也有一個公式都沒有的大家。
      
      而科斯無疑是最典型的個例。科斯是學數學的,沒人能懷疑他的數學功力,但是科斯交易費用理論的論文數學很少。如果能夠用更多人理解的方式描述,其影響范圍自然更大,獲取應用創(chuàng)造價值的機會就更多。
      
      美國的金融危機,原因也是金融工程的發(fā)展已經讓多數人無法理解其產品,從而失去了市場矯正的機會。華爾街寬客門很多都有數學或者物理學博士學位,他們建立了越來越復雜的模型,最后精致的數學模型都可以用很美麗的數學去解釋,但是就是沒辦法與真實的世界聯系起來,結果大家都知道了。
      
      回過頭來說推薦引擎,我的數學很差,是個新丁。但是以我的觀察,商業(yè)推薦引擎成敗算法只是其中一個因素。只有少數的推薦引擎要用到最尖端的數學算法。而多數推薦引擎成效的提升往往依靠對用戶心理的了解,更合理的用戶界面設計。
      
      比如推薦算法一個關鍵問題,數據噪音和數據稀疏性問題,可以用數學方式解決,也可以依靠用戶行為的改善來矯正。
      
      我理解好的推薦引擎應該是這樣的:一個高效率的算法+設計很好的用戶行為。所以做產品規(guī)劃的時候,一定要再這兩個方面著力才行。
  •   呵呵,先說明一下,我數學也很差,數學公式多了看著也頭疼。用最少的數學公式,或者盡量不用,那是最完美的狀態(tài)。反過來,數學這么讓人頭疼,卻依然無處不在,就是因為它不可避免。
    要實現有效的推薦系統,算法肯定不是唯一重要的東西。簡單的算法往往已經能達到不錯的推薦效果,至于是不是還需要更復雜的算法,取決于網站和用戶對他的期待。
  •   那這個做模型的慘了
  •   紀念一下,這個述評掛了一個多月只有40多人閱讀,昨天被挑燈看劍推薦了一下閱讀量已經增加到150了
  •   哈哈,我再來推一下,討論的氣氛很好
  •   頂評論~ 同樣不喜歡這本書。不敢想象有人拿書里的代碼去實現某個算法……
  •   我同意樓主的想法。講得深入淺出很難,寫滿數學公式去解釋一個理論的作者,也是沒有辦法才那樣的
  •   @ Chen_1st (大寫西愛吃一嗯下劃線1愛斯替)
      
    你寫道:

    但如果要根據不同的應用設計自己的算法,而不是僅僅拷貝別人的算法,那么掌握數學語言并進行更深入的學習顯然是非常必要的。

    那麼,請問需要深入學習哪些正宗的數學?統計學嗎?
  •   @Info.Zeitgeist
    統計學,矩陣分析,優(yōu)化理論,還有泛函分析
    不過最好還是用到什么學什么,不然很難堅持下來。哪里看不懂再去學可能好點。上面這些我也不是都認真學了。用到什么學什么的問題是基礎總覺得不扎實。
  •   @ Chen_1st
      
    多謝指路。
      
    你寫道:

    用到什么學什么的問題是基礎總覺得不扎實。

      
    我個人有個比喻是:用到什麼學什麼好比是 top down(fundamental science 是 bottom, applied science 是 top),一步一步從基礎學好比是 bottom up。
      
    同時做 top down 和 bottom up 的學習是最理想的?!爸褂^雙運”。但是,很難有足夠的時間。大悲大悲。
  •   贊一個止觀雙運,沒時間只能慢慢來了。
    前面還沒問題,后面章節(jié)里的一些公式和原理沒細講,等于magic,基本就只能看一個樂了
  •   熱帖留名~
  •   嚴重同意,沒有免費的午餐,深刻體會?,F在覺得數學公式好壞都是浮云,效果和易操作是關鍵。吼吼,不知道是不是我從一個極端又走到另外一個極端了?
  •   NFL本身就應該有個free lunch~
  •   同意這個
    統計學,矩陣分析,優(yōu)化理論,還有泛函分析
    不過順序可能要變下 統計學的基礎部分概率論可以分出來 先學 然后是矩陣分析 或者線性代數 接著可能就是泛函分析 走完前面的就可以再來更廣義的統計(機器學習部分)和優(yōu)化理論了
  •   贊,這個討論就已經足夠有養(yǎng)分了。
  •   做dimension reduction,難免會碰到manifold。
    學manifold,一般會碰到topology
    做Bayesian nonparametrics,難免會碰到measure theory。
    做semi-supervised learning,可能會用到Spectra Graph Theory。
    一開始還是先看看introductory real analysis比較好,可以給后面看稍微抽象的數學打個基礎
  •   所言甚是,看著簡單說明教得不深入
  •   書里太多篇幅講基礎代碼,并且實現的也一般;類似k-means這種算法直接用SciPy包得了
  •   為什么集體智慧編程不是java實現,而用python
    對于后續(xù)會出2ed嗎?
  •   把抽象的數學推理的過程翻譯成符合邏輯的簡單步驟,足以證明作者對這些算法理解很透徹了,而且不是停留在理論上的理解,能在實踐中加以改造。舉個例子說:神經網絡那一節(jié),他沒有按照理論的構造所有的隱藏節(jié)點,對參數的存儲也加以改善,這種活學活用的思維方式在實際工程中幫助很大。再假如,如果要寫一個產品的需求文檔,如果寫上一些數學推理的公式,顯然不太合時宜。 但作為一本講學習機器學習的書籍,書中最好還是加入理論學習的數目或者文章連接,這樣對應學習的人深入理解要好點。
  •   數學不好,的確是覺得此書真心很艱深
    淚目路過
  •   樓主,我感覺搞工程的完全沒有必要看這本書,,,,,,,
  •   請問您找到本書的課后習題答案了嗎?
  •   沒有。。。
 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網 手機版

京ICP備13047387號-7