出版時間:2007-12 出版社:清華大學(xué) 作者:毛國君[等]編著 頁數(shù):329
Tag標(biāo)簽:無
內(nèi)容概要
本書是一本全面介紹數(shù)據(jù)挖掘和知識發(fā)現(xiàn)技術(shù)的專業(yè)書籍,它系統(tǒng)地闡述了數(shù)據(jù)挖掘和知識發(fā)現(xiàn)技術(shù)的產(chǎn)生、發(fā)展、應(yīng)用以及相關(guān)概念、原理和算法,對數(shù)據(jù)挖掘中的主要技術(shù)分支,包括關(guān)聯(lián)規(guī)則、分類、聚類、序列、空間以及web挖掘等進(jìn)行了理淪剖析和算法描述。本書的許多內(nèi)容是作者們在攻讀博士學(xué)位期間的工作總結(jié),一方面,對于相關(guān)概念和技術(shù)的闡述盡量先從理論分析人手,在此基礎(chǔ)上進(jìn)行技術(shù)歸納;另一方面,為了保證技術(shù)的系統(tǒng)性,所有的挖掘模型和算法描述都在統(tǒng)一的技術(shù)歸納框架下進(jìn)行。同時,為了避免抽象算法描述給讀者帶來的理解困難,本書的所有典型算法都通過具體跟蹤執(zhí)行實例來進(jìn)一步說明。 本書共分8章,各章相對獨(dú)立成篇,以利于讀者選擇性學(xué)習(xí)。在每章后面都設(shè)置專門一節(jié)來對本章內(nèi)容和文獻(xiàn)引用情況進(jìn)行歸納,它不僅可以幫助讀者對相關(guān)內(nèi)容進(jìn)行整理,而且也起到對本內(nèi)容相關(guān)文獻(xiàn)的注釋性索引功能。第1章是緒論,系統(tǒng)地介紹了數(shù)據(jù)挖掘產(chǎn)生的商業(yè)和技術(shù)背景,從不同側(cè)面剖析了數(shù)據(jù)挖掘的概念和應(yīng)用價值;第2章給出了知識發(fā)現(xiàn)的過程分析和應(yīng)用體系結(jié)構(gòu)設(shè)計;第3章對關(guān)聯(lián)規(guī)則挖掘的原理和算法進(jìn)行全面闡述;第4章給出分類的主要理論和算法描述;第5章討論聚類的常用技術(shù)和算法;第6章對時間序列分析技術(shù)和序列挖掘算法進(jìn)行論述;第7章系統(tǒng)地介紹了Web挖掘的主要研究領(lǐng)域和相關(guān)技術(shù)及算法;第8章是對空間數(shù)據(jù)挖掘技術(shù)和算法的分析和講述。 本書可作為計算機(jī)專業(yè)研究生或高年級本科生教材,也可以作為從事計算機(jī)研究和開發(fā)人員的參考資料。作為教材,教師可以根據(jù)課時安排進(jìn)行選擇性教學(xué)。為了更好地讓教師進(jìn)行選擇性教學(xué),本書配有專門的教師用書,對內(nèi)容的重點、難點和課時分配給出了對應(yīng)的建議,對重要的和難度較大的習(xí)題進(jìn)行了分析和解答。對于研究人員,本書是一本高參考價值的專業(yè)書籍。對于軟件技術(shù)人員,可以把它當(dāng)作提高用書或參考資料,一些算法可以通過改造用于實際的應(yīng)用系統(tǒng)中。
書籍目錄
第1章 緒論 1.1 數(shù)據(jù)挖掘技術(shù)的產(chǎn)生與發(fā)展 1.2 數(shù)據(jù)挖掘研究的發(fā)展趨勢 1.3 數(shù)據(jù)控制的概念 1.4 數(shù)據(jù)挖掘技術(shù)的分類問題 1.5 數(shù)據(jù)挖掘常用的知識表示模式與方法 1.6 不同數(shù)據(jù)存儲形式下的數(shù)據(jù)挖掘問題 1.7 粗糙集方法及其在數(shù)據(jù)挖掘中的應(yīng)用 1.8 數(shù)據(jù)挖掘的應(yīng)用分析 1.9 本章小結(jié)和文獻(xiàn)注釋 習(xí)題1第2章 知識發(fā)現(xiàn)過程與應(yīng)用結(jié)構(gòu) 2.1 知識發(fā)現(xiàn)的基本過程 2.2 數(shù)據(jù)庫中的知識發(fā)現(xiàn)處理過程模型 2.3 知識發(fā)現(xiàn)軟件或工具的發(fā)展 2.4 知識發(fā)現(xiàn)項目的過程化管理 2.5 數(shù)據(jù)挖掘語言介紹 2.6 本章小結(jié)和文獻(xiàn)注釋 習(xí)題2第3章 關(guān)聯(lián)規(guī)則挖掘理論和算法 3.1 基本概念與解決方法 3.2 經(jīng)典的頻繁項目集生成算法分析 3.3 Apriori算法的性能瓶頸問題 3.4 Apriori的改進(jìn)算法 3.5 對項目集空間理論的發(fā)展 3.6 項目集格空間和它的操作 3.7 基于項目集操作的關(guān)聯(lián)規(guī)則挖掘算法 3.8 改善關(guān)聯(lián)規(guī)則挖掘質(zhì)量問題 3.9 約束數(shù)據(jù)挖掘問題 3.10 時態(tài)約束關(guān)聯(lián)規(guī)則挖掘 3.11 關(guān)聯(lián)規(guī)則挖掘中的一些更深入的問題 3.12 數(shù)量關(guān)聯(lián)規(guī)則挖掘方法 3.13 本章小結(jié)和文獻(xiàn)注釋 習(xí)題3 第4章 分類方法 4.1 分類的基本概念與步驟 4.2 基于距離的分類算法 4.3 決策樹分類方法 4.4 貝葉斯分類 4.5 規(guī)則歸納 4.6 與分類有關(guān)的其他問題 4.7 本章小結(jié)和文獻(xiàn)注釋 習(xí)題4第5章 聚類方法 5.1 概述 5.2 劃分聚類方法 5.3 層次聚類方法 5.4 密度聚類方法 5.5 其他聚類方法 5.6 本章小結(jié)和文獻(xiàn)注釋 習(xí)題5第6章 時間序列和序列模式挖掘 6.1 時間序列及其應(yīng)用 6.2 時間序列預(yù)測的常用方法 6.3 基于ARMA模型的序列匹配方法 6.4 基于離散傅里葉變換的時間序列相似性查找 6.5 基于規(guī)范變換的查找方法 6.6 序列挖掘 6.7 AprioriAll算法 6.8 AprioriSome算法 6.9 GSP算法 9.10 本章小結(jié)和文獻(xiàn)注釋 習(xí)題6第7章 Web挖掘技術(shù) 7.1 Web挖掘的分類 7.2 Web挖掘的含義 7.3 Web挖掘的數(shù)據(jù)來源 7.4 Web內(nèi)容挖掘方法 7.5 Web內(nèi)容挖掘方法 7.6 Web訪問信息挖掘方法 7.7 Web結(jié)構(gòu)挖掘方法 7.8 本章小結(jié)和文獻(xiàn)注釋 習(xí)題7第8章 空間挖掘 8.1 引言 8.2 空間數(shù)據(jù)概要 8.3 空間數(shù)據(jù)挖掘基礎(chǔ) 8.4 空間統(tǒng)計學(xué) 8.5 泛化與特化 8.6 空間規(guī)則 8.7 空間分類算法 8.8 空間聚類算法 8.9 空間挖掘的其他問題 8.10 空間數(shù)據(jù)挖掘原型系列介紹 8.11 空間數(shù)據(jù)挖掘的研究現(xiàn)狀 8.12 空間數(shù)據(jù)挖掘的研究與發(fā)展方向 8.13 空間數(shù)據(jù)挖掘與相關(guān)學(xué)科的關(guān)系 8.14 數(shù)字地球 8.15 本章小結(jié)和文獻(xiàn)注釋 習(xí)題8參考文獻(xiàn)
圖書封面
圖書標(biāo)簽Tags
無
評論、評分、閱讀與下載