數(shù)據(jù)挖掘技術及其應用

出版時間:2011-1  出版社:上海交通大學出版社  作者:楊杰,姚莉秀  頁數(shù):263  字數(shù):319000  
Tag標簽:無  

內容概要

《數(shù)據(jù)挖掘技術及其應用(精)》(作者楊杰、姚莉秀)系統(tǒng)地講述了數(shù)據(jù)挖掘的基本概念和基本原理,并列舉了在相應領域具有參考價值的算法及其改進和應用,是作者多年來從事教學和科研實踐的成果。全書共9章,主要內容有:數(shù)據(jù)挖掘的基本概念和原理,數(shù)據(jù)預處理,各種分類、聚類和關聯(lián)規(guī)則提取算法,以及在生物信息學、材料學中的實際應用案例。
《數(shù)據(jù)挖掘技術及其應用(精)》可用作計算機專業(yè)本科高年級學生或研究生的教材或參考書,也可供從事計算機信息處理、數(shù)據(jù)挖掘、工業(yè)優(yōu)化等有關方面工作的科技人員參考。

作者簡介

楊杰,男,1964年8月出生于上海,漢族。獲德國漢堡大學計算機系工學博士學位,上海交通大學圖像處理與模式識別研究所教授,博士生導師。
姚莉秀,現(xiàn)為上海交通大學圖象處理及模式識別研究所副教授、博士。 杭州大學本科畢業(yè),中科院冶金所博士畢業(yè)。

書籍目錄

第1章 導論
1.1 數(shù)據(jù)挖掘技術的源起與發(fā)展
1.2 數(shù)據(jù)挖掘的概念
1.3 數(shù)據(jù)挖掘的過程
1.4 數(shù)據(jù)挖掘的功能
1.5 數(shù)據(jù)挖掘的典型應用領域
1.6 目前國際上流行的數(shù)據(jù)挖掘軟件
參考文獻
第2章 數(shù)據(jù)預處理
2.1 數(shù)據(jù)清理
2.2 數(shù)據(jù)集成
2.3 數(shù)據(jù)轉換
2.4 數(shù)據(jù)約簡
參考文獻
第3章 維約簡——特征選擇與特征提取
3.1 特征選擇
3.2 特征提取
3.3 基于譜分析的降維框架
參考文獻
第4章 關聯(lián)規(guī)則提取與粗糙集
4.1 基本概念
4.2 經典的關聯(lián)規(guī)則挖掘算法
4.3 模糊關聯(lián)規(guī)則的發(fā)現(xiàn)
4.4 數(shù)量屬性關聯(lián)規(guī)則的挖掘
4.5 面向不確定知識的關聯(lián)規(guī)則挖掘——粗糙集理論與應用
4.6 基于粗糙集和微粒群算法的特征選擇(PSORSFS)
4.7 基于有序PSO的粗糙集近似熵約簡
4.8 基于模糊粗糙集的最近鄰聚類分類算法
參考文獻
第5章 分類原理與方法
5.1 一般概念
5.2 基于歸納的傳統(tǒng)決策樹方法
5.3 超平面決策樹方法
5.4 復合式評價函數(shù)
5.5 模糊類別的決策樹方法
5.6 基于模糊極小極大網絡的模糊規(guī)則提取與分類
5.7 Linear Map(LMAP)方法與包容型數(shù)據(jù)
參考文獻
第6章 統(tǒng)計學習理論與支持向量機
6.1 簡介
6.2 統(tǒng)計學習理論的主要內容
6.3 支持向量機理論
6.4 基于測地距離的SV.M分類算法
6.5 基于SOR(Successive Over Relaxation)的支持向量回歸
訓練方法
參考文獻
第7章 聚類分析
7.1 聚類的基本概念
7.2 常見聚類算法
7.3 特征空間屬性加權模糊核聚類算法
7.4 基于信息理論的合作模糊聚類算法研究
7.5 基于密度和網格的子空間聚類算法
參考文獻
第8章 數(shù)據(jù)挖掘在生物信息學中的應用
8.1 基于集成分類器的蛋白序列分析
8.2 聚類分析在基因表達數(shù)據(jù)中的應用
8.3 基于有監(jiān)督聚類算法的蛋白三維結構分類
參考文獻
第9章 數(shù)據(jù)挖掘在合金相圖研究中的應用
9.1 國內外相圖研究現(xiàn)狀
9.2 相圖研究的原子參數(shù)一數(shù)據(jù)挖掘方法
9.3 研究三元合金系中間化合物形成規(guī)律的原理與方法
9.4 國內外相圖研究現(xiàn)狀:三元合金系中間化合物形成規(guī)律研究
參考文獻

章節(jié)摘錄

版權頁:插圖:1.4 數(shù)據(jù)挖掘的功能數(shù)據(jù)挖掘通過對現(xiàn)有數(shù)據(jù)記錄的分析,預測未來趨勢及行為,做出基于知識的決策。數(shù)據(jù)挖掘的目標是從大量數(shù)據(jù)中發(fā)現(xiàn)隱含的、有意義的知識,主要有以下幾類功能。1)概念描述被分析的數(shù)據(jù)稱為目標數(shù)據(jù)集,像程序設計語言C++里面的對象與類一樣,對于一個數(shù)據(jù)集,我們可以通過其共有的屬性和行為來描述它,最終獲得簡明、準確的描述,使之更具代表性。2)相關分析(關聯(lián)分析)就是從給定的數(shù)據(jù)集發(fā)現(xiàn)頻繁出現(xiàn)的項集模式知識,即發(fā)現(xiàn)各屬性之間的關聯(lián)關系并用關聯(lián)規(guī)則描述出來。3)分類和回歸預報根據(jù)一系列已知數(shù)據(jù),訓練產生一套能描述或區(qū)別數(shù)據(jù)的類別或概念的模型,并能夠根據(jù)這個模型來預測未知數(shù)據(jù)的結果。人臉識別、指紋識別、商業(yè)中的客戶識別分類、工業(yè)上故障診斷等都是分類問題。4)聚類根據(jù)物以類聚原則,利用屬性特征將數(shù)據(jù)集合分成為由類似的數(shù)據(jù)組成的多個類的過程稱為聚類。聚類后,同一類之間的數(shù)據(jù)具有很強的相似性而非同類之間的數(shù)據(jù)具有很強的非相似性。5)趨勢分析實現(xiàn)前面提到的四種功能時,事件產生的順序信息都被忽略,被簡單地作為一條靜態(tài)的記錄來對待。而趨勢分析是對隨時間變化的數(shù)據(jù)對象的變化規(guī)律和趨勢進行建模描述,根據(jù)前一段時間的運動預測下一個時間點的狀態(tài)。解決的問題一般可分為兩類:(1)總結數(shù)據(jù)的序列或者變化趨勢,如預測股票/期貨交易,網頁點擊順序記錄等。

編輯推薦

《數(shù)據(jù)挖掘技術及其應用》是由上海交通大學出版社出版的。

圖書封面

圖書標簽Tags

評論、評分、閱讀與下載


    數(shù)據(jù)挖掘技術及其應用 PDF格式下載


用戶評論 (總計0條)

 
 

 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網 手機版

京ICP備13047387號-7