統(tǒng)計學習方法

出版時間:2012-3  出版社:清華大學出版社  作者:李航  頁數(shù):235  
Tag標簽:無  

內(nèi)容概要

  統(tǒng)計學習是計算機及其應(yīng)用領(lǐng)域的一門重要的學科。本書全面系統(tǒng)地介紹了統(tǒng)計學習的主要方法,特別是監(jiān)督學習方法,包括感知機、k近鄰法、樸素貝葉斯法、決策樹、邏輯斯諦回歸與最大熵模型、支持向量機、提升方法、em算法、隱馬爾可夫模型和條件隨機場等。除第1章概論和最后一章總結(jié)外,每章介紹一種方法。敘述從具體問題或?qū)嵗胧?,由淺入深,闡明思路,給出必要的數(shù)學推導,便于讀者掌握統(tǒng)計學習方法的實質(zhì),學會運用。為滿足讀者進一步學習的需要,書中還介紹了一些相關(guān)研究,給出了少量習題,列出了主要參考文獻。
  《統(tǒng)計學習方法》是統(tǒng)計學習及相關(guān)課程的教學參考書,適用于高等院校文本數(shù)據(jù)挖掘、信息檢索及自然語言處理等專業(yè)的大學生、研究生,也可供從事計算機應(yīng)用相關(guān)專業(yè)的研發(fā)人員參考。

作者簡介

李航,日本京都大學電氣工程系畢業(yè),日本東京大學計算機科學博士。曾任職于日本NEC公司中央研究所,現(xiàn)任微軟亞洲研究院高級研究員及主任研究員。北京大學、南開大學、西安交通大學客座教授。研究方向包括信息檢索、自然語言處理、統(tǒng)計機器學習及數(shù)據(jù)挖掘。

書籍目錄

第1章 統(tǒng)計學習方法概論
 1.1 統(tǒng)計學習
 1.2 監(jiān)督學習
 1.3 統(tǒng)計學習三要素
 1.4 模型評估與模型選擇
 1.5 i~則化與交叉驗證
 1.6 泛化能力
 1.7 生成模型與判別模型
 1.8 分類問題
 1.9 標注問題
 1.10 回歸問題
 本章概要
 繼續(xù)閱讀
 習題
 參考文獻
第2章 感知機
 2.1 感知機模型
 2.2 感知機學習策略
 2.3 感知機學習算法
 本章概要
 繼續(xù)閱讀
 習題
 參考文獻
第3章眾近鄰法
 3.1 k近鄰算法
 3.2 k近鄰模型
 3.3 k近鄰法的實現(xiàn):kd樹
 本章概要
 繼續(xù)閱讀
 習題
 參考文獻
第4章 樸素貝葉斯法
 4.1 樸素貝葉斯法的學習與分類
 4.2 樸素貝葉斯法的參數(shù)估計
 本章概要
 繼續(xù)閱讀
 習題
 參考文獻
第5章 決策樹
第6章 邏輯斯諦回歸與最大熵模型
第7章 支持向量機
第8章 提升方法
第9章 em算法及其推廣
第10章 隱馬爾可夫模型
第11章 條件隨機場
第12章 統(tǒng)計學習方法總結(jié)
附錄a 梯度下降法
附錄b 牛頓法和擬牛頓法
附錄c 拉格朗日對偶性
索引

章節(jié)摘錄

版權(quán)頁:   插圖:   第1章 統(tǒng)計學習方法概論 本章簡要敘述統(tǒng)計學習方法的一些基本概念.這是對全書內(nèi)容的概括,也是全書內(nèi)容的基礎(chǔ).首先敘述統(tǒng)計學習的定義、研究對象與方法;然后敘述監(jiān)督學習,這是本書的主要內(nèi)容;接著提出統(tǒng)計學習方法的三要素:模型、策略和算法;介紹模型選擇,包括正則化、交叉驗證與學習的泛化能力;介紹生成模型與判別模型;最后介紹監(jiān)督學習方法的應(yīng)用:分類問題、標注問題與回歸問題. 1.1 統(tǒng)計學習 1.統(tǒng)計學習的特點 統(tǒng)計學習(statistical learning)是關(guān)于計算機基于數(shù)據(jù)構(gòu)建概率統(tǒng)計模型并運用模型對數(shù)據(jù)進行預測與分析的一門學科.統(tǒng)計學習也稱為統(tǒng)計機器學習(statistical machine learning). 統(tǒng)計學習的主要特點是:(1)統(tǒng)計學習以計算機及網(wǎng)絡(luò)為平臺,是建立在計算機及網(wǎng)絡(luò)之上的;(2)統(tǒng)計學習以數(shù)據(jù)為研究對象,是數(shù)據(jù)驅(qū)動的學科;(3)統(tǒng)計學習的目的是對數(shù)據(jù)進行預測與分析;(4)統(tǒng)計學習以方法為中心,統(tǒng)計學習方法構(gòu)建模型并應(yīng)用模型進行預測與分析;(5)統(tǒng)計學習是概率論、統(tǒng)計學、信息論、計算理論、最優(yōu)化理論及計算機科學等多個領(lǐng)域的交叉學科,并且在發(fā)展中逐步形成獨自的理論體系與方法論. 赫爾伯特?西蒙(Herbert A.Simon)曾對“學習”給出以下定義:“如果一個系統(tǒng)能夠通過執(zhí)行某個過程改進它的性能,這就是學習.”按照這一觀點,統(tǒng)計學習就是計算機系統(tǒng)通過運用數(shù)據(jù)及統(tǒng)計方法提高系統(tǒng)性能的機器學習.現(xiàn)在,當人們提及機器學習時,往往是指統(tǒng)計機器學習. 2.統(tǒng)計學習的對象 統(tǒng)計學習的對象是數(shù)據(jù)(data).它從數(shù)據(jù)出發(fā),提取數(shù)據(jù)的特征,抽象出數(shù)據(jù)的模型,發(fā)現(xiàn)數(shù)據(jù)中的知識,又回到對數(shù)據(jù)的分析與預測中去.作為統(tǒng)計學習的對象,數(shù)據(jù)是多樣的,包括存在于計算機及網(wǎng)絡(luò)上的各種數(shù)字、文字、圖像、視頻、音頻數(shù)據(jù)以及它們的組合. 統(tǒng)計學習關(guān)于數(shù)據(jù)的基本假設(shè)是同類數(shù)據(jù)具有一定的統(tǒng)計規(guī)律性,這是統(tǒng)計學習的前提.這里的同類數(shù)據(jù)是指具有某種共同性質(zhì)的數(shù)據(jù),例如英文文章、互聯(lián)網(wǎng)網(wǎng)頁、數(shù)據(jù)庫中的數(shù)據(jù)等.由于它們具有統(tǒng)計規(guī)律性,所以可以用概率統(tǒng)計方法來加以處理.比如,可以用隨機變量描述數(shù)據(jù)中的特征,用概率分布描述數(shù)據(jù)的統(tǒng)計規(guī)律. 在統(tǒng)計學習過程中,以變量或變量組表示數(shù)據(jù).數(shù)據(jù)分為由連續(xù)變量和離散變量表示的類型.本書以討論離散變量的方法為主.另外,本書只涉及利用數(shù)據(jù)構(gòu)建模型及利用模型對數(shù)據(jù)進行分析與預測,對數(shù)據(jù)的觀測和收集等問題不作討論。

編輯推薦

《統(tǒng)計學習方法》是統(tǒng)計學習及相關(guān)課程的教學參考書,適用于高等院校文本數(shù)據(jù)挖掘、信息檢索及自然語言處理等專業(yè)的大學生、研究生,也可供從事計算機應(yīng)用相關(guān)專業(yè)的研發(fā)人員參考。

圖書封面

圖書標簽Tags

評論、評分、閱讀與下載


    統(tǒng)計學習方法 PDF格式下載


用戶評論 (總計110條)

 
 

  •   介紹的很系統(tǒng),有理論分析,也有實例分析,對于理解各種統(tǒng)計學習算法很有幫助!
  •   統(tǒng)計學習方法 寫的很棒
  •   統(tǒng)計學習方面很好的一本書,個人感覺對于實際應(yīng)用來說值得一讀
  •   書很好,對統(tǒng)計方法講的很全面。
  •   聽很多人推薦。。準備好好學習一下統(tǒng)計的基礎(chǔ)知識
  •   對學習方法的總結(jié)
  •   這本書對機器學習領(lǐng)域內(nèi)常見的概念做了簡單直觀而又清晰的描述。我認為很適合相關(guān)人員閱讀。
  •   機器學習,數(shù)據(jù)挖掘必備書,比較好懂
  •   詳細的數(shù)學推導和算法介紹
  •   這本書給了我很大幫助,尤其是機器學習方面,是我的入門教材,沒有廢話,全是從簡單到復雜很詳細很容易理解的公式推導!
  •   李航博士是機器學習領(lǐng)域的牛人啦,書的內(nèi)容不那么全面和深,但作為一本入門書寫到這樣很不錯了,贊一個!
  •   機器學習數(shù)學基礎(chǔ)必須得會,書很不錯,封面很簡潔
  •   書的質(zhì)量還是很不錯的,價格有些小貴。里面全部都是原理的講解,很適合喜歡數(shù)學的程序員的學習。同時,紙的質(zhì)量非常好。是一本值得收藏的好書。全書言簡意賅,概念清楚,有些地方講的不是很詳細。總體來說,非常值得一買
  •   專業(yè)性較強,比較適合機器學習專業(yè)的人看。作為數(shù)學系的看起來很帶感……
  •   結(jié)合STANFORD的機器學習課程看,很好
  •   學習統(tǒng)計學入門級書。
  •   數(shù)據(jù)挖掘的老師推薦的入門數(shù)學基本!?。?br /> 內(nèi)容很好?。?!書的質(zhì)量也很好?。?!
  •   不錯,非常利于現(xiàn)在的學習。
  •   機器學習方面的好書啊
  •   挺好的,適合學習,推薦看一下
  •   這本書適合搞數(shù)據(jù)挖掘的人看,我同事正在讀博士,一口氣買了4本。
  •   做數(shù)據(jù)挖掘的同學一定要看看! 很基礎(chǔ),很好!
  •   每章都是獨立的 內(nèi)容也挺不錯 適合自學
  •   公式推導的很詳細, 基本上都能看懂
  •   別看封面不就樸素,里面不少干貨!
  •   書內(nèi)內(nèi)容涵蓋比較廣,而且單章成書,可以不順序的看書,想用哪方面的知識都可以在書中查到.留著作為參考用的基礎(chǔ)書,確實不錯.
  •   需要很多數(shù)學知識。。
  •   介紹的有些簡略,適合有一定基礎(chǔ)的人來看
  •   書講的很仔細,非計算機專業(yè)的也能看懂
  •   當天下單,當天送到。書的內(nèi)容對于沒有數(shù)學基礎(chǔ)的人有點難啊
  •   好書,清新,干凈的感覺。分門類,分主題,快速入門,文獻索引。
  •   先前借同學的看過一些,讀了感覺很不錯,所以自己買一本,可以在書上做些筆記,以后用到還可以翻閱。內(nèi)容很清楚,有很清楚的證明,還有例子,很喜歡。
  •   這兩本書是我最近最期待看的書
  •   這本書短小精悍,內(nèi)容翔實,比起市面上相關(guān)教材真是好的太多太多。說明作者對書中的內(nèi)容確實是真懂,講得深入淺出,不像其它的書寫的都是一個抄一個,看似厚厚一本,讀完毫無收獲。強烈推薦
  •   講的不錯,深入淺出,但是,難度有些大,需要花功夫看。
  •   略顯枯燥簡單,但一本講理論的書算不錯的;這是一本給你理論輪廓的書,我自認讀理論書籍,分為兩步:1、知道理論的輪廓 2、看清大量的細節(jié)。這本書作用就是讓你達到第一步的書
  •   李航老師的大作 書比較薄 適合拿在手邊經(jīng)??聪?/li>
  •   書的質(zhì)量很好,送貨的速度也挺快的。
  •   適合初學者,很好的書,值得推薦?。。?!
  •   書很薄,但含金量高,發(fā)貨快,好
  •   書是很好的,可能趕上活動物流有點慢,由于換了電話,我給快遞打電話,那女的態(tài)度實在太差了,氣死我了,本來好好的一次購物被那女的攪合了
  •   書是別人推薦的,雖然還沒看,不過我相信一定是本好書!
  •   書德內(nèi)容很好,而且很新。
  •   書很干凈,完整。內(nèi)容上作為一本初級入門書籍,還不錯。
  •   國內(nèi)最好的書,不用多說
  •   開始第一本書拿過來很臟,然后走了換貨流程,2天給換了,倍兒新的一本,不錯不錯
  •   周圍很多人推薦這本書,可以當入門書籍。剛到手,看完再分享~~
  •   這本書還是不錯的,但是講得不夠細致
  •   配送的好快呀,晚上下單,第二天一早就送達
  •   vip折扣的時候買的可以說很劃算了
  •   整體感覺還不錯,很滿意,配送也很不錯~
  •   好書!不得不說是一本寫的很好的圖書!看起來 很正!
  •   內(nèi)容寫得不錯,適合初學者。
  •   java 的經(jīng)典書籍
  •   非常適合入門級的同學閱讀 很好
  •   李航老師的著作,久聞大名,不能不看
  •   講的很基礎(chǔ),對入門很有幫助!
  •   還沒有細看,用的時侯翻閱的
  •   還沒開始看,不過翻了一下目錄,大致看了一下內(nèi)容,感覺還不錯
  •   關(guān)注很久了。上次5折沒買,現(xiàn)在8折賣的。噢~
  •   短小精干,挺好的
  •   實用,適合入門。
  •   值得一讀,還是比較容易懂涵蓋的范圍比較廣~不過至今仍然有很多不懂>__
  •   越看越想看,越看越愛看
  •   導師推薦的書目之一,寫的比較容易看懂,挺好的,發(fā)貨也很快
  •   看起來像教材,好有壓力啊。。
  •   講解清晰,比較到位。
  •   將各種概念講的比較清楚。
  •   內(nèi)容翔實,贊!
  •   相當?shù)牟诲e相當?shù)牟诲e相當?shù)牟诲e相當?shù)牟诲e
  •   對于各種統(tǒng)計學習方法都有較好的介紹,理論性不強,屬于入門書籍
  •   是機器學習相關(guān)的算法理論的濃縮精品,需要一定基礎(chǔ)來閱讀,或是在閱讀時查閱其他文獻,書不厚但是內(nèi)容充實,建議從事相關(guān)研究的研究生或是有志參與進來的本科生閱讀。相關(guān)方面的理論啟蒙叢書僅此一本。
  •   從微博上看到李老師的這本書,看過目錄后覺得很喜歡~
    昨天拿到手的,整體感覺沒有想象中的內(nèi)容多,就像李老師自己說的,這是一本入門級的教材。
    書中有大量的數(shù)學公式,幾乎每一頁都是公式公式……如果特別討厭數(shù)學的話,還是不要買了,呵呵
    李老師不愧是在這一行研究了這么久了,書中的內(nèi)容總結(jié)的非常好,敘述也是通俗易懂,沒有用很生澀的語言,而且配以實例,更加易懂,想做機器學習方面內(nèi)容的,還是看看吧
  •   這本書,重點講了統(tǒng)計學的具體學習方法,能夠舉一反三
  •   還沒有讀,不過書中大多是方法以及推導過程的論述,如果多些實例分析更好了。類似于《數(shù)學之美》那種
  •   對于想學習自然語言處理的人來說,此書是經(jīng)典。
  •   關(guān)于機器學習關(guān)鍵算法的濃縮版 不錯
  •   就有監(jiān)督學習講的比較深入,但是國內(nèi)的書籍大都是教授式的,引人思考的不多
  •   寫得不錯,適于初學者學習。不過封面上寫“著”字就不太厚道了
  •   正版書籍,專業(yè)書不能有錯。支持正版。
  •   幫女兒買的,她說還不錯,她的專業(yè)正需要。
  •   因為需要所以買了,沒有特價也沒啥特別的。
  •   比較簡略,需要配合其他的書一起閱讀。
  •   還沒仔細看,粗略的翻了一下,感覺還不錯,不過看這本書還是要有點數(shù)學基礎(chǔ)的。
  •   書籍很好,還帶著一層塑料薄膜紙。具體內(nèi)容還未仔細看,別人推薦的。
  •   內(nèi)容全面 質(zhì)量也不錯
  •   基本內(nèi)容還算全面
  •   購買書的原因是推薦,不過該書對我深了點,暫時沒來得及看
  •   導師推薦要看的書,就是現(xiàn)在的圖書價格太貴了
  •   本書的受眾主要為NLP/IR初學者或基礎(chǔ)薄弱的實踐者,對有監(jiān)督學習中一些常用方法提供了深度適中的理論闡釋。優(yōu)點:語言與內(nèi)容安排相當精煉,數(shù)學表達也通俗易懂,特別適合拿不出大把時間去啃Hastie、Bishop或Duda那幾本經(jīng)典磚頭的一眾苦嗶新人拿這本200頁的書來在相對經(jīng)濟的時間里補充統(tǒng)計學習基本常識。缺點:本書沒有覆蓋無監(jiān)督和半監(jiān)督學習的常見方法(作者好像在前言中提及可能打算放到以后的寫作中)。此外,既然目標是為NLP/IR人士提供參考,希望下一版作者可以根據(jù)相關(guān)高水平國際會議上的見聞,在每章增加一節(jié)專門介紹一下有關(guān)方法較為新穎和巧妙的應(yīng)用。算得上一本值得購買的書,給四點五分四舍五入順便期待下一版。
  •   很好的數(shù)據(jù)挖掘分類算法介紹資料
  •   書籍是正版不錯,發(fā)貨速度也可以。價格也做出了優(yōu)惠~關(guān)鍵是,書的一角已經(jīng)嚴重磨損!換書的話太麻煩,但我希望商家本著信譽至上的原則,不能因為是網(wǎng)購就給與磨損的書。而如果給與用戶磨損的書,你就應(yīng)該給與折扣!我經(jīng)常在亞馬遜買東西,但卻是為數(shù)不多的評論。希望商家改正,不要再出現(xiàn)這樣的事情
  •   這本書主要講統(tǒng)計機器學習中的分類。整本書不厚,講的比較精煉。包裝完好無損,印刷清晰,快遞速度滿意!
  •   講的深不深,淺不淺。。。
  •   這本書適合大家學習機器學習的概念
  •   不是很有用的一本書,收藏價值很一般
  •   通俗易懂,介紹了多個經(jīng)典模型。
  •   送貨速度很快,晚上下單,第二天下午就到了。書的內(nèi)容很好,質(zhì)量也很好,紙質(zhì)不錯~~
  •   書很給力,是正版的,店家還用了緩沖泡包裝袋給裝的。但是比較悲劇的是快遞有點兒不給力,把書弄折了一點兒。
  •   同學推薦的,很詳細很不錯
 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7