出版時間:2009-6 出版社:機械工業(yè)出版社 作者:Ethen Alpaydin 頁數(shù):272 譯者:范明,昝紅英,牛常勇
Tag標簽:無
前言
自從有計算機以來,人們就希望計算機能夠學習。然而,機器學習真正取得實質性進展,能夠成功地解決一些實際問題,并最終成為一個學科分支還是近20余年的事?! τ谠S多問題,我們的前人和先行者已經知道如何求解。例如,歐幾里德告訴我們可以用輾轉相除法求兩個整數(shù)的最大公約數(shù);Dijkstra告訴我們如何有效地求兩點之間的最短路徑;Hoare向我們展示了怎樣將雜亂無章的對象快速排序……對于這些問題,我們清楚地知道求解步驟。因此,讓計算機求解這些問題只需要設計算法和數(shù)據(jù)結構、進行編程,而不需要讓計算機學習?! ∵€有一些事情,人們可以輕而易舉地做好,但是卻無法解釋清楚我們是如何做的。例如,盡管桌子千差萬別、用途各異,但是我們一眼就能看出某個物體是否是桌子;盡管不同的人的手寫阿拉伯數(shù)字大小不一、筆畫粗細不同,但是我們還是可以輕易識別一個數(shù)字是不是;盡管聲音時大時小、有時可能還有點沙啞,但是我們還是可以不費力氣地聽出熟人的聲音。諸如此類的例子不勝枚舉。對于這些問題,我們不知道求解步驟。因此,讓計算機來做這些事就需要讓計算機學習?! ∥覀冎雷雷硬皇悄静暮透鞣N材料的隨機堆砌,手寫數(shù)字不是像素的隨機分布,熟人的聲音也不是各種聲波的隨機混合?,F(xiàn)實世界總是有規(guī)律的。機器學習正是從已知實例中自動發(fā)現(xiàn)規(guī)律,建立對未知實例的預測模型;根據(jù)經驗不斷提高,不斷改進預測性能?! ∵@是關于機器學習這一主題全面論述的教科書,適合作為高等院校計算機相關專業(yè)高年級本科生和研究生機器學習入門課程的教材。該書涵蓋了監(jiān)督學習、貝葉斯決策理論、參數(shù)方法、多元方法、維度歸約、聚類、非參數(shù)方法、決策樹、線性判別式、多層感知器、局部模型:隱馬爾可夫模型、分類算法評估和比較、組合多學習器以及增強學習。作者對來自統(tǒng)計學、模式識別、神經網絡、人工智能、信號處理、控制和數(shù)據(jù)挖掘等不同領域的機器學習問題和學習方法進行了統(tǒng)一論述。
內容概要
機器學習的目標是對計算機編程,以便使用樣本數(shù)據(jù)或以往的經驗來解決給定的問題。已經有許多機器學習的成功應用,包括分析以往銷售數(shù)據(jù)來預測客戶行為,人臉識別或語音識別,優(yōu)化機器人行為以便使用最少的資源來完成任務,以及從生物信息數(shù)據(jù)中提取知識的各種系統(tǒng)。為了對機器學習問題和解進行統(tǒng)一的論述,本書討論了機器學習在統(tǒng)計學、模式識別、神經網絡。人工智能。信號處理、控制和數(shù)據(jù)挖掘等不同領域的應用。對所有學習算法都進行了解釋,以便讀者可以容易地將書中的公式轉變?yōu)橛嬎銠C程序。本書可作為高等院校計算機相關專業(yè)高年級本科生和研究生的教材,也可供研究機器學習方法的技術人員參考?! ”緯鴮C器學習的定義和應用實例進行了介紹,涵蓋了監(jiān)督學習。貝葉斯決策理論。參數(shù)方法、多元方法、維度歸約、聚類、非參數(shù)方法、決策樹。線性判別式、多層感知器,局部模型、隱馬爾可夫模型。分類算法評估和比較,組合多學習器以及增強學習等。
作者簡介
Ethem Alpaydin,是土耳其伊斯坦布爾博阿齊奇大學計算機工程系的教授。于1990年在洛桑聯(lián)邦理工學院獲博士學位,之后先后在美國麻省理工和伯克利大學工作和進行博士后研究。Ethem博士主要從事機器學習方面的研究,是劍橋大學的《The Computer Journal》雜志編委和Elsevier
書籍目錄
出版者的話中文版序譯者序前言致謝符號表第1章 緒論 1.1 什么是機器學習 1.2 機器學習的應用實例 1.2.1 學習關聯(lián)性 1.2.2 分類 1.2.3 回歸 1.2.4 非監(jiān)督學習 1.2.5 增強學習 1.3 注釋 1.4 相關資源 1.5 習題 1.6 參考文獻第2章 監(jiān)督學習 2.1 由實例學習類 2.2 VC維 2.3 概率逼近正確學習 2.4 噪聲 2.5 學習多類 2.6 回歸 2.7 模型選擇與泛化 2.8 監(jiān)督機器學習算法的維 2.9 注釋 2.10 習題 2.11 參考文獻第3章 貝葉斯決策定理 3.1 引言 3.2 分類 3.3 損失與風險 3.4 判別式函數(shù) 3.5 效用理論 3.6 信息值 3.7 貝葉斯網絡 3.8 影響圖 3.9 關聯(lián)規(guī)則 3.10 注釋 3.11 習題 3.12 參考文獻第4章 參數(shù)方法 4.1 引言 4.2 最大似然估計 4.2.1 伯努利密度 4.2.2 多項密度 4.2.3 高斯(正態(tài))密度 4.3 評價估計:偏倚和方差 4.4 貝葉斯估計 4.5 參數(shù)分類 4.6 回歸 4.7 調整模型的復雜度:偏倚/方差兩難選擇 4.8 模型選擇過程 4.9 注釋 4.10 習題 4.11 參考文獻第5章 多元方法 5.1 多元數(shù)據(jù) 5.2 參數(shù)估計 5.3 缺失值估計 5.4 多元正態(tài)分布 5.5 多元分類……第6章 維度旭納第7章 聚類第8章 非參數(shù)方法第9章 決策樹第10章 線性判別式第11章 多層感知器第12章 局部模型 第13章 隱馬爾可夫模型 第14章 分類算法評估和比較第15章 組合多學習器第16章 增強學習
章節(jié)摘錄
第1章 緒論 1.1 什么是機器學習 隨著計算機技術的發(fā)展,我們現(xiàn)在已經擁有存儲和處理海量數(shù)據(jù)以及通過計算機網絡從遠程站點訪問數(shù)據(jù)的能力。目前大多數(shù)的數(shù)據(jù)存取設備都是數(shù)字設備,記錄的數(shù)據(jù)也很可靠。以一家連鎖超市為例,它擁有遍布全國各地的數(shù)百家分店,并且在為數(shù)百萬顧客提供數(shù)千種商品的零售服務。銷售點的終端設備記錄每筆交易的詳細資料,包括日期、顧客識別碼、購買商品和數(shù)量、消費總額等。這是典型的每日幾個一字節(jié)的數(shù)據(jù)。只有分析這些數(shù)據(jù),并且將它轉換為可以利用的信息時,這些存儲的數(shù)據(jù)才能變得有用,例如做預測?! ∥覀儾荒艽_切地知道哪些人比較傾向于購買哪種特定的商品,也不知道應該向喜歡讀海明威作品的人推薦哪位作者。如果我們知道,我們就不需要任何數(shù)據(jù)分析;我們只管供貨并記錄下編碼就可以了。但是,正因為我們不知道,所以才只能收集數(shù)據(jù),并期望從數(shù)據(jù)中提取這些問題或相似問題的答案?! ∥覀兇_信存在某種過程,可以解釋我們所觀測到的數(shù)據(jù)。盡管我們不清楚數(shù)據(jù)產生過程(例如顧客行為)的細節(jié),但是,我們知道數(shù)據(jù)產生不是完全隨機的。人們并不是去超市隨機購買商品。當人們買啤酒時,也會買薯片;夏天買冰淇淋,而冬天則為Gltthwein買香料。數(shù)據(jù)中存在確定的模式。
圖書封面
圖書標簽Tags
無
評論、評分、閱讀與下載