數(shù)據(jù)挖掘算法與Clementine實踐

出版時間:2011-4  出版社:清華大學  作者:熊平  頁數(shù):237  
Tag標簽:無  

內(nèi)容概要

  《數(shù)據(jù)挖掘算法與Clementine實踐》主要介紹了幾種最成熟的數(shù)據(jù)挖掘方法,并針對每種方法,介紹了應用最廣泛的幾種實現(xiàn)算法。書中以Clementine
12.0為平臺,用實例介紹了每種算法的具體應用。全書各章分別介紹了數(shù)據(jù)挖掘和Clementine軟件、決策樹分類方法(包括ID3、C4.5、C5.0、CART等算法)、聚類分析方法(包括K-Means算法和TwoStep算法)、關聯(lián)規(guī)則挖掘方法(包括Apriori算法、CARMA算法和序列模式挖掘算法)、數(shù)據(jù)篩選算法(包括特征選擇算法和異常檢測算法)、回歸分析方法(包括線性回歸算法和二項Logistic回歸)、神經(jīng)網(wǎng)絡構(gòu)建方法(包括多層感知器網(wǎng)絡、RBF網(wǎng)絡以及Kohonen網(wǎng)絡的構(gòu)建算法)、時間序列分析方法(包括指數(shù)平滑法和ARIMA模型構(gòu)建方法)。
  

書籍目錄

第1章 數(shù)據(jù)挖掘概述
1.1 數(shù)據(jù)挖掘簡介
1.2 數(shù)據(jù)挖掘過程
1.3 數(shù)據(jù)挖掘方法
1.4 數(shù)據(jù)挖掘工具及軟件
第2章 clementine概述
2.1 clementine簡介
2.2 clementine基本操作
第3章 決策樹
3.1 分類與決策樹概述
3.2 id3、c4.5與c5.0
3.3 cart
第4章 聚類分析
4.1 聚類分析概述
4.2 k-means算法
4.3 twostep算法
第5章 關聯(lián)規(guī)則
5.1 關聯(lián)規(guī)則概述
5.2 apriori算法
5.3 carma算法
5.4 序列模式
第6章 數(shù)據(jù)篩選
6.1 特征選擇
6.2 異常檢測
第7章 統(tǒng)計模型
7.1 線性回歸
7.2 項logistic回歸
第8章 神經(jīng)網(wǎng)絡
8.1 神經(jīng)網(wǎng)絡原理
8.2 多層感知器與rbf網(wǎng)絡
8.3 kohonen網(wǎng)絡
第9章 時間序列分析與預測
9.1 時間序列概述
9.2 指數(shù)平滑法
9.3 arima模型
參考文獻

章節(jié)摘錄

版權(quán)頁:插圖:統(tǒng)計方法COBWEB-是一個常用的且簡單的增量式概念聚類方法。它的輸入對象是采用符號量(屬性一值)對來加以描述的。采用分類樹的形式來創(chuàng)建一個層次聚類。CLASSIT是COBWEB的另一個版本。它可以對連續(xù)取值屬性進行增量式聚類。它為每個節(jié)點中的每個屬性保存相應的連續(xù)正態(tài)分布(均值與方差);并利用一個改進的分類能力描述方法,即不像COBWEB那樣計算離散屬性(取值)和而是對連續(xù)屬性求積分。但是CLASSIT方法也存在與COBWEB類似的問題。因此它們都不適合對大數(shù)據(jù)庫進行聚類處理。傳統(tǒng)的聚類算法已經(jīng)比較成功地解決了低維數(shù)據(jù)的聚類問題。但是由于實際應用中數(shù)據(jù)的復雜性,在處理許多問題時,現(xiàn)有的算法經(jīng)常失效,特別是對于高維數(shù)據(jù)和大型數(shù)據(jù)的情況。因為傳統(tǒng)聚類方法在高維數(shù)據(jù)集中進行聚類時,主要遇到兩個問題。首先,高維數(shù)據(jù)集中存在大量無關的屬性使得在所有維中存在簇的可能性幾乎為零。另外,高維空間中數(shù)據(jù)較低維空間中數(shù)據(jù)分布要稀疏,其中數(shù)據(jù)間距離幾乎相等是普遍現(xiàn)象,而傳統(tǒng)聚類方法是基于距離進行聚類的,因此在高維空間中無法基于距離來構(gòu)建簇。高維聚類分析已成為聚類分析的一個重要研究方向。同時高維數(shù)據(jù)聚類也是聚類技術的難點。隨著技術的進步使得數(shù)據(jù)收集變得越來越容易,導致數(shù)據(jù)庫規(guī)模越來越大、復雜性越來越高,如各種類型的貿(mào)易交易數(shù)據(jù)、Web文檔、基因表達數(shù)據(jù)等,它們的維度(屬性)通??梢赃_到成百上千維,甚至更高。但是,受“維度效應”的影響,許多在低維數(shù)據(jù)空間表現(xiàn)良好的聚類方法運用在高維空間上往往無法獲得好的聚類效果。高維數(shù)據(jù)聚類分析是聚類分析中一個非?;钴S的領域,同時它也是一個具有挑戰(zhàn)性的工作。

編輯推薦

《數(shù)據(jù)挖掘算法與Clementine實踐》是由清華大學出版社出版的。

圖書封面

圖書標簽Tags

評論、評分、閱讀與下載


    數(shù)據(jù)挖掘算法與Clementine實踐 PDF格式下載


用戶評論 (總計24條)

 
 

  •   講解使用Clementine工具進行數(shù)據(jù)挖掘的算法。很好
  •   內(nèi)容比較新穎,難得有很多實驗數(shù)據(jù)可以提供
  •   基礎且實用,書不錯,可以用于基礎的學習
  •   看起來不錯,例子挺多
  •   老公評價挺高的。
  •   速度較快,比較滿意!
  •   大概翻閱一下,感覺還行
  •   沒來及看,總體還行。
  •   內(nèi)容尚可,但是有些地方寫的不是很詳細。
  •   紙張一般,正在看
  •   這書主要是講如何使用cleantime工具的,算法講解一般
  •   內(nèi)容感覺很一般,有點小失望!
  •   入門教材,物有所值,值得初級人員入手
  •   沒有全部看完,但是感覺還可以。
  •   還行吧,好久沒看到了,被老師拿走就沒還我
  •   書的內(nèi)容跟網(wǎng)上的差不多,是正版!
  •   案例偏簡單,適合快速入門。
  •   配送速度很OK,書的內(nèi)容頁基本滿意,圍繞幾個主要的數(shù)據(jù)挖掘算法以clementine為工具簡單介紹了應用,但是感覺內(nèi)容太簡單,書的質(zhì)量比較一般
  •   中午剛收到書,內(nèi)容還沒看,但是書的封面很臟,書左上角白色區(qū)域有很大一片黑色污漬,黑有一個戳穿的小孔,書左下角的粘合處有很深的擠壓凹進去的痕跡,總之對書很不滿意,影響心情。由于書是急著用所以沒有申請推過。真的懷疑這些書是不是實體店里因為有瑕疵銷售不出去的才拿到網(wǎng)上用相對便宜價格處理掉。
  •   有例子,實用,沒那么虛
  •   還算可以,就是紙質(zhì)太差,也有點失望
  •   雖然書中很多內(nèi)容出自Clementine12.0的用戶手冊,但是很有針對性。書中的例子也很詳細,算法和軟件上手的內(nèi)容很適合入門者。值得推薦。
  •   操作講解比較詳細,結(jié)果分析也還行。只是案例相對簡單,缺乏深度
  •     因為之前一直用SPSS做數(shù)據(jù)分析,現(xiàn)在計劃用Clementine做一下數(shù)據(jù)挖掘。所以買了這本書讀了一下,內(nèi)容介紹的比較清晰和易于理解。不足之處是書太薄了,不夠詳細(比如很多指標的含義)。作為一本入門書,我覺得足夠了。
 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7