出版時(shí)間:2013-1 出版社:電子工業(yè)出版社 作者:羅森林 頁數(shù):242 字?jǐn)?shù):400000
Tag標(biāo)簽:無
內(nèi)容概要
本書梳理了數(shù)據(jù)挖掘理論與技術(shù)的知識點(diǎn),注重領(lǐng)域內(nèi)核心思想、原理、方法的論述及國內(nèi)外最新研究進(jìn)展的融入,內(nèi)容上系統(tǒng)、全面、先進(jìn)。全書共9章,主要包括數(shù)據(jù)挖掘基礎(chǔ)知識,概率論與數(shù)理統(tǒng)計(jì),數(shù)據(jù)挖掘效果評價(jià),數(shù)據(jù)預(yù)處理,數(shù)據(jù)倉庫,數(shù)據(jù)分類分析,數(shù)據(jù)聚類分析,關(guān)聯(lián)規(guī)則發(fā)現(xiàn),統(tǒng)計(jì)預(yù)測方法等。在討論算法的同時(shí)引入應(yīng)用實(shí)例,強(qiáng)調(diào)應(yīng)用方法包括算法特點(diǎn)、參數(shù)選擇、結(jié)果評價(jià)等方面的分析,理論聯(lián)系實(shí)際,有利于算法的快速掌握和有效運(yùn)用。
書籍目錄
第1章 緒論
1.1 數(shù)據(jù)挖掘產(chǎn)生的背景
1.1.1 技術(shù)背景
1.1.2 理論基礎(chǔ)
1.1.3 數(shù)據(jù)挖掘相關(guān)概念
1.2 數(shù)據(jù)挖掘知識基礎(chǔ)
1.2.1 基本概念及特點(diǎn)
1.2.2 數(shù)據(jù)集
1.2.3 功能與分類
1.2.4 任務(wù)與過程
1.2.5 方法與步驟
1.3 數(shù)據(jù)挖掘簡史與現(xiàn)狀
1.3.1 簡史
1.3.2 現(xiàn)狀
1.4 數(shù)據(jù)挖掘的技術(shù)工具
1.4.1 技術(shù)工具
1.4.2 工具選擇
1.5 數(shù)據(jù)挖掘的應(yīng)用
1.5.1 典型應(yīng)用
1.5.2 高級應(yīng)用
1.6 技術(shù)難點(diǎn)與發(fā)展趨勢
1.6.1 常見誤解
1.6.2 技術(shù)難點(diǎn)
1.6.3 發(fā)展趨勢
1.7 本章小結(jié)
思考題
第2章 概率統(tǒng)計(jì)理論基礎(chǔ)
2.1 引言
2.2 概率統(tǒng)計(jì)知識基礎(chǔ)
2.3 隨機(jī)變量的分布函數(shù)
2.3.1 多維隨機(jī)變量
2.3.2 條件分布
2.4 統(tǒng)計(jì)推理
2.5 參數(shù)估計(jì)
2.5.1 估計(jì)理論
2.5.2 最大似然估計(jì)
2.5.3 貝葉斯估計(jì)
2.6 假設(shè)檢驗(yàn)
2.7 數(shù)據(jù)采樣方法
2.8 本章小結(jié)
思考題
第3章 數(shù)據(jù)挖掘效果評價(jià)
3.1 引言
3.2 模型的評分函數(shù)
3.2.1 基本概念
3.2.2 預(yù)測模型的評分函數(shù)
3.2.3 描述模型的評分函數(shù)
3.3 模型的比較與驗(yàn)證
3.3.1 模型比較
3.3.2 模型驗(yàn)證
3.4 模型的性能提升
3.4.1 增量學(xué)習(xí)
3.4.2 半監(jiān)督學(xué)習(xí)
3.4.3 遷移學(xué)習(xí)
3.4.4 反模型
3.4.5 Boosting
3.5 模型的建立與使用
3.5.1 模型的建立
3.5.2 模型的理解
3.5.3 模型的使用
3.6 本章小結(jié)
思考題
第4章 數(shù)據(jù)預(yù)處理
4.1 引言
4.2 數(shù)據(jù)預(yù)處理知識基礎(chǔ)
4.3 數(shù)據(jù)清理
4.3.1 遺漏值
4.3.2 噪聲數(shù)據(jù)
4.3.3 不一致數(shù)據(jù)
4.4 數(shù)據(jù)集成
4.5 數(shù)據(jù)轉(zhuǎn)換
4.6 數(shù)據(jù)規(guī)約
4.6.1 數(shù)據(jù)方聚集
4.6.2 維歸約
4.6.3 數(shù)據(jù)壓縮
4.6.4 數(shù)值歸約
4.7 數(shù)據(jù)離散
4.8 應(yīng)用實(shí)例分析
4.8.1 腹圍空缺數(shù)值歸一化彌補(bǔ)方法
4.8.2 Ⅱ型糖尿病數(shù)據(jù)預(yù)處理
4.9 本章小結(jié)
思考題
第5章 數(shù)據(jù)倉庫
5.1 引言
5.2 數(shù)據(jù)倉庫知識基礎(chǔ)
5.2.1 基本概念
5.2.2 基本作用
5.2.3 與數(shù)據(jù)挖據(jù)的關(guān)系
5.3 數(shù)據(jù)倉庫中的模型
5.3.1 概念模型
5.3.2 物理模型
5.3.3 元數(shù)據(jù)模型
5.3.4 多維數(shù)據(jù)模型
5.4 數(shù)據(jù)倉庫系統(tǒng)結(jié)構(gòu)
5.4.1 組成
5.4.2 數(shù)據(jù)倉庫概念結(jié)構(gòu)
5.4.3 數(shù)據(jù)倉庫結(jié)構(gòu)類型
5.5 OLAP分析
5.5.1 知識基礎(chǔ)
5.5.2 多維分析
5.5.3 OLAP結(jié)構(gòu)
5.5.4 多維數(shù)據(jù)庫
5.5.5 關(guān)系數(shù)據(jù)庫
5.6 本章小結(jié)
思考題
第6章 數(shù)據(jù)分類分析
6.1 引言
6.2 分類分析知識基礎(chǔ)
6.2.1 基本概念
6.2.2 基本作用
6.2.3 評價(jià)方法
6.3 主要技術(shù)方法及分析
6.4 貝葉斯分類
6.4.1 樸素貝葉斯分類法
6.4.2 貝葉斯網(wǎng)絡(luò)
6.4.3 動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)
6.5 基于決策樹的算法
6.5.1 基本思想
6.5.2 ID3算法
6.5.3 C4.5算法
6.5.4 SLIQ算法
6.5.5 SPRINT算法
6.6 神經(jīng)網(wǎng)絡(luò)與遺傳算法
6.6.1 神經(jīng)網(wǎng)絡(luò)
6.6.2 遺傳算法
6.7 支持向量機(jī)
6.8 粗糙集與模糊集
6.8.1 粗糙集
6.8.2 模糊集
6.9 最大熵模型
6.10 應(yīng)用實(shí)例分析
6.10.1 漢語句義類型識別
6.10.2 特定音頻事件識別
6.11 本章小結(jié)
思考題
第7章 數(shù)據(jù)聚類分析
7.1 引言
7.2 聚類分析知識基礎(chǔ)
7.2.1 基本概念
7.2.2 基本作用
7.2.3 近鄰測度
7.2.4 評價(jià)方法
7.3 主要技術(shù)方法及分析
7.4 基于劃分的算法
7.4.1 基本思想
7.4.2 K-means算法
7.4.3 K-medoids算法
7.4.4 CLARANS算法
7.5 基于層次的算法
7.5.1 基本思想
7.5.2 BIRCH算法
7.5.3 CURE算法
7.5.4 ROCK算法
7.5.5 Chameleon算法
7.6 基于密度的算法
7.6.1 基本思想
7.6.2 DBSCAN算法
7.6.3 OPTICS算法
7.6.4 DENCLUE算法
7.7 基于網(wǎng)格的算法
7.7.1 基本思想
7.7.2 STING算法
7.7.3 Wave Cluster算法
7.7.4 CLIQUE算法
7.8 基于模型的算法
7.8.1 基本思想
7.8.2 EM算法
7.8.3 COBWEB算法
7.8.4 自組織神經(jīng)網(wǎng)絡(luò)
7.9 應(yīng)用實(shí)例分析
7.9.1 鏡頭聚類
7.9.2 文本聚類
7.10 本章小結(jié)
思考題
第8章 關(guān)聯(lián)規(guī)則發(fā)現(xiàn)
8.1 引言
8.2 關(guān)聯(lián)規(guī)則發(fā)現(xiàn)知識基礎(chǔ)
8.2.1 基本概念
8.2.2 評價(jià)方法
8.2.3 注意事項(xiàng)
8.3 主要技術(shù)方法及分析
8.4 關(guān)聯(lián)規(guī)則的基本算法
8.4.1 Apriori算法
8.4.2 FP-樹頻集算法
8.4.3 CloSpan
8.5 并行和分布式關(guān)聯(lián)規(guī)則算法
8.5.1 并行關(guān)聯(lián)規(guī)則
8.5.2 分布式關(guān)聯(lián)規(guī)則
8.6 多層次關(guān)聯(lián)規(guī)則算法
8.7 數(shù)量關(guān)聯(lián)規(guī)則算法
8.8 應(yīng)用實(shí)例分析——蠕蟲檢測
8.9 本章小結(jié)
思考題
第9章 統(tǒng)計(jì)預(yù)測方法
9.1 引言
9.2 統(tǒng)計(jì)預(yù)測方法知識基礎(chǔ)
9.3 主要技術(shù)方法及分析
9.4 回歸預(yù)測方法
9.4.1 線性和多元回歸
9.4.2 非線性回歸
9.5 Box-Jenkins回歸
9.6 隱馬模型
9.6.1 隱馬爾可夫模型
9.6.2 隱半馬爾可夫模型
9.7 應(yīng)用實(shí)例分析
9.7.1 Ⅱ型糖尿病發(fā)病危險(xiǎn)狀態(tài)預(yù)測
9.7.2 關(guān)鍵人物判定
9.8 本章小結(jié)
思考題
參考文獻(xiàn)
編輯推薦
羅森林編著的《數(shù)據(jù)挖掘理論與技術(shù)》梳理了數(shù)據(jù)挖掘理論與技術(shù)的知識點(diǎn),注重領(lǐng)域內(nèi)核心思想、原理、方法的論述及國內(nèi)外最新研究進(jìn)展的融入,內(nèi)容上系統(tǒng)、全面、先進(jìn)。本書可供計(jì)算機(jī)科學(xué)與技術(shù)、生命信息工程、軟件工程、通信與信息系統(tǒng)等相關(guān)學(xué)科、專業(yè)的學(xué)生作為教材或參考書,同時(shí)也可供科研人員參考和感興趣者自學(xué)使用。
圖書封面
圖書標(biāo)簽Tags
無
評論、評分、閱讀與下載
數(shù)據(jù)挖掘理論與技術(shù) PDF格式下載