出版時間:2011-4 出版社:清華大學 作者:熊平 頁數(shù):237
Tag標簽:無
內(nèi)容概要
《數(shù)據(jù)挖掘算法與Clementine實踐》主要介紹了幾種最成熟的數(shù)據(jù)挖掘方法,并針對每種方法,介紹了應用最廣泛的幾種實現(xiàn)算法。書中以Clementine
12.0為平臺,用實例介紹了每種算法的具體應用。全書各章分別介紹了數(shù)據(jù)挖掘和Clementine軟件、決策樹分類方法(包括ID3、C4.5、C5.0、CART等算法)、聚類分析方法(包括K-Means算法和TwoStep算法)、關聯(lián)規(guī)則挖掘方法(包括Apriori算法、CARMA算法和序列模式挖掘算法)、數(shù)據(jù)篩選算法(包括特征選擇算法和異常檢測算法)、回歸分析方法(包括線性回歸算法和二項Logistic回歸)、神經(jīng)網(wǎng)絡構(gòu)建方法(包括多層感知器網(wǎng)絡、RBF網(wǎng)絡以及Kohonen網(wǎng)絡的構(gòu)建算法)、時間序列分析方法(包括指數(shù)平滑法和ARIMA模型構(gòu)建方法)。
書籍目錄
第1章 數(shù)據(jù)挖掘概述
1.1 數(shù)據(jù)挖掘簡介
1.2 數(shù)據(jù)挖掘過程
1.3 數(shù)據(jù)挖掘方法
1.4 數(shù)據(jù)挖掘工具及軟件
第2章 clementine概述
2.1 clementine簡介
2.2 clementine基本操作
第3章 決策樹
3.1 分類與決策樹概述
3.2 id3、c4.5與c5.0
3.3 cart
第4章 聚類分析
4.1 聚類分析概述
4.2 k-means算法
4.3 twostep算法
第5章 關聯(lián)規(guī)則
5.1 關聯(lián)規(guī)則概述
5.2 apriori算法
5.3 carma算法
5.4 序列模式
第6章 數(shù)據(jù)篩選
6.1 特征選擇
6.2 異常檢測
第7章 統(tǒng)計模型
7.1 線性回歸
7.2 項logistic回歸
第8章 神經(jīng)網(wǎng)絡
8.1 神經(jīng)網(wǎng)絡原理
8.2 多層感知器與rbf網(wǎng)絡
8.3 kohonen網(wǎng)絡
第9章 時間序列分析與預測
9.1 時間序列概述
9.2 指數(shù)平滑法
9.3 arima模型
參考文獻
章節(jié)摘錄
版權(quán)頁:插圖:統(tǒng)計方法COBWEB-是一個常用的且簡單的增量式概念聚類方法。它的輸入對象是采用符號量(屬性一值)對來加以描述的。采用分類樹的形式來創(chuàng)建一個層次聚類。CLASSIT是COBWEB的另一個版本。它可以對連續(xù)取值屬性進行增量式聚類。它為每個節(jié)點中的每個屬性保存相應的連續(xù)正態(tài)分布(均值與方差);并利用一個改進的分類能力描述方法,即不像COBWEB那樣計算離散屬性(取值)和而是對連續(xù)屬性求積分。但是CLASSIT方法也存在與COBWEB類似的問題。因此它們都不適合對大數(shù)據(jù)庫進行聚類處理。傳統(tǒng)的聚類算法已經(jīng)比較成功地解決了低維數(shù)據(jù)的聚類問題。但是由于實際應用中數(shù)據(jù)的復雜性,在處理許多問題時,現(xiàn)有的算法經(jīng)常失效,特別是對于高維數(shù)據(jù)和大型數(shù)據(jù)的情況。因為傳統(tǒng)聚類方法在高維數(shù)據(jù)集中進行聚類時,主要遇到兩個問題。首先,高維數(shù)據(jù)集中存在大量無關的屬性使得在所有維中存在簇的可能性幾乎為零。另外,高維空間中數(shù)據(jù)較低維空間中數(shù)據(jù)分布要稀疏,其中數(shù)據(jù)間距離幾乎相等是普遍現(xiàn)象,而傳統(tǒng)聚類方法是基于距離進行聚類的,因此在高維空間中無法基于距離來構(gòu)建簇。高維聚類分析已成為聚類分析的一個重要研究方向。同時高維數(shù)據(jù)聚類也是聚類技術的難點。隨著技術的進步使得數(shù)據(jù)收集變得越來越容易,導致數(shù)據(jù)庫規(guī)模越來越大、復雜性越來越高,如各種類型的貿(mào)易交易數(shù)據(jù)、Web文檔、基因表達數(shù)據(jù)等,它們的維度(屬性)通??梢赃_到成百上千維,甚至更高。但是,受“維度效應”的影響,許多在低維數(shù)據(jù)空間表現(xiàn)良好的聚類方法運用在高維空間上往往無法獲得好的聚類效果。高維數(shù)據(jù)聚類分析是聚類分析中一個非?;钴S的領域,同時它也是一個具有挑戰(zhàn)性的工作。
編輯推薦
《數(shù)據(jù)挖掘算法與Clementine實踐》是由清華大學出版社出版的。
圖書封面
圖書標簽Tags
無
評論、評分、閱讀與下載
數(shù)據(jù)挖掘算法與Clementine實踐 PDF格式下載