出版時間:2009-7 出版社:西南財經(jīng)大學(xué)出版社 作者:李保坤,張麗娟 頁數(shù):136
Tag標簽:無
內(nèi)容概要
《數(shù)據(jù)挖掘教程》的文字內(nèi)容主要參考了美國麻省理工學(xué)院的數(shù)據(jù)挖掘開放講義、國外許多大學(xué)老師關(guān)于數(shù)據(jù)挖掘課程的教學(xué)資料以及網(wǎng)絡(luò)上對有關(guān)算法的介紹材料。書中使用的數(shù)據(jù)均來自統(tǒng)計學(xué)教材或數(shù)據(jù)挖掘教材中使用的標準數(shù)據(jù),數(shù)據(jù)分析結(jié)果和圖形展示由作者自己制作的西南財經(jīng)大學(xué)數(shù)據(jù)挖掘系統(tǒng)軟件生成。
作者簡介
李保坤,美國新墨新墨西哥州立大學(xué)博士,西南財經(jīng)大學(xué)統(tǒng)計學(xué)院副教授,應(yīng)用統(tǒng)計研究所副所長。
書籍目錄
第一章 介紹1.1 這本書的讀者對象1.2 什么是數(shù)據(jù)挖掘1.3 數(shù)據(jù)挖掘的用途1.4 數(shù)據(jù)挖掘的起源1.5 術(shù)語和注釋1.6 數(shù)據(jù)集合的組織1.7 數(shù)據(jù)挖掘迅速發(fā)展的因素第二章 數(shù)據(jù)挖掘過程概覽2.1 數(shù)據(jù)挖掘的核心思想2.2 有約束學(xué)習(xí)和無約束學(xué)習(xí)2.3 數(shù)據(jù)挖掘的步驟2.4 SEMMA2.5 預(yù)備階段附錄:數(shù)據(jù)分塊方法2.6建立模型--線性回歸的一個例子第三章 有約束學(xué)習(xí)--分類和預(yù)測3.1 一個分兩類的分類法3.2 貝葉斯最小誤差法則3.3 采用分類誤差作為標準的分類方法評價3.4 不對稱錯誤分類代價和貝葉斯風(fēng)險3.5 分層采樣和不對稱代價3.6 推廣到多于兩類的情況3.7 提升圖3.8 波士頓住房(兩類)3.9 采用三分(Triage)策略的分類第四章 多元線性回歸4.1 多元線性回歸復(fù)習(xí)4.2 回歸過程舉例4.3 線性回歸的自變量選擇4.4 線性回歸分析的一般步驟第五章 Logistic回歸5.1 一個簡單例子5.2 Logistic回歸模型5.3 機會比(Odds Ratio)5.4 概率5.5 模型擬合的又一個例子附錄A:回歸系數(shù)的極大似然估計和置信區(qū)間計算附錄B:使用西南財大數(shù)據(jù)挖掘系統(tǒng)對波士頓住宅區(qū)的數(shù)據(jù)處理第六章 神經(jīng)網(wǎng)絡(luò)6.1 神經(jīng)元(一個數(shù)學(xué)模型)6.2 神經(jīng)網(wǎng)絡(luò)6.3 費歇爾(Fisher)的鳶尾花數(shù)據(jù)6.4 后向傳播算法--分類6.5 調(diào)整網(wǎng)絡(luò)用于預(yù)測6.6 多個區(qū)域最優(yōu)和遍數(shù)6.7 過分擬合和訓(xùn)練遍數(shù)的選擇6.8 結(jié)構(gòu)的適應(yīng)性選擇6.9 成功應(yīng)用的例子附錄:使用西南財大數(shù)據(jù)挖掘系統(tǒng)的神經(jīng)網(wǎng)絡(luò)分類演示第七章 分類與回歸樹7.1 分類樹7.2 遞歸分區(qū)7.3 騎乘式割草機7.4 剪枝7.5 最小誤差樹7.6 最佳剪枝樹7.7 樹的分類規(guī)則7.8 回歸樹附錄:西南財大數(shù)據(jù)挖掘系統(tǒng)分類樹介紹第八章 判別分析8.1 騎乘式割草機8.2 Fisher的線性判別函數(shù)8.3 貝葉斯線性分類函數(shù)8.4 距離度量8.5 分類誤差8.6 鳶尾花的分類附錄A:馬氏距離附錄B:西南財大數(shù)據(jù)挖掘系統(tǒng)的判別分析第九章 其他有約束學(xué)習(xí)方法9.1 K-最近鄰點9.2 簡單貝葉斯9.3 簡單貝葉斯分類實例第十章 關(guān)聯(lián)分析--關(guān)聯(lián)法則10.1 發(fā)現(xiàn)交易數(shù)據(jù)庫里的關(guān)聯(lián)法則10.2 支持度和置信度10.3 增益和重要性10.4 相關(guān)系數(shù)和負關(guān)聯(lián)法則10.5 先驗算法10.6 缺點第十一章 數(shù)據(jù)精簡和探索11.1 降維--主成分分析11.2 成年長子的頭部測量數(shù)值11.3 主成分11.4 葡萄酒的特征11.5 數(shù)據(jù)標準化11.6 主成分和正交最小二乘第十二章 聚類分析12.1 什么是聚類分析?12.2 電力公司數(shù)據(jù)12.3 層次聚類法12.4 k-均值算法12.5 相似測度12.6 其他的距離測度附錄:西南財大數(shù)據(jù)挖掘系統(tǒng)的聚類分析
章節(jié)摘錄
第一章 介紹 1.1 這本書的讀者對象 數(shù)據(jù)挖掘通常要涉及統(tǒng)計和機器學(xué)習(xí)(或者叫做人工智能)方面的算法。如果作者的目的只是讓讀者掌握數(shù)據(jù)挖掘的技術(shù)和工具的話,這類書籍因為缺乏詳細的解釋,因此對讀者的指導(dǎo)作用就不會太強。另外也有許多關(guān)于數(shù)據(jù)挖掘算法比較專業(yè)的書籍,它們的對象是統(tǒng)計研究人員或者高年級的研究生,里面沒有具體的商業(yè)案例分析,因此一般的讀者會覺得太澀。有鑒于此,我們在寫作此書時內(nèi)容上主要突出了以下兩個特色: ?。?)介紹分類、預(yù)測、數(shù)據(jù)精簡等數(shù)據(jù)挖掘核心技術(shù)的基礎(chǔ)理論和算法; ?。?)采用商業(yè)案例說明這些算法的使用?! ×硗猓@本書在形式上和普通的書籍有一個顯著的區(qū)別:它配備了一套演示各種算法的軟件——西南財經(jīng)大學(xué)數(shù)據(jù)挖掘系統(tǒng),供讀者理解數(shù)據(jù)挖掘思想、算法以及進行數(shù)據(jù)挖掘練習(xí)。
圖書封面
圖書標簽Tags
無
評論、評分、閱讀與下載