出版時間:2006-1 出版社:人民郵電出版社 作者:[美] Pang-Ning Tan,Michael Steinbach,Vipin Kumar 著 頁數(shù):516
Tag標(biāo)簽:無
內(nèi)容概要
本書對數(shù)據(jù)挖掘進(jìn)行了全面介紹,旨在為讀者提供將數(shù)據(jù)挖掘應(yīng)用于實(shí)際問題所必需的知識。本書涵蓋五個主題:數(shù)據(jù)、分類、關(guān)聯(lián)分析、聚類和異常檢測。除異常檢測外,每個主題都有兩章:前面一章講述基本概念、代表性算法和評估技術(shù),而后面一章較深入地討論高級概念和算法。目的是在使讀者透徹地理解數(shù)據(jù)挖掘基礎(chǔ)的同時,還能了解更多重要的高級主題。此外,書中還提供了大量例子、圖表和習(xí)題。 本書適合作為相關(guān)專業(yè)高年級本科生和研究生數(shù)據(jù)挖掘課程的教材,同時也可作為從事數(shù)據(jù)挖掘研究和應(yīng)用開發(fā)工作的技術(shù)人員的參考書。
作者簡介
作者:(美)譚Pang-Ning Tan 現(xiàn)為密歇根州立大學(xué)計算機(jī)與工程系助理教授,主要教授數(shù)據(jù)挖掘、數(shù)據(jù)庫系統(tǒng)等課程。此前,他曾是明尼蘇達(dá)大學(xué)美國陸軍高性能計算研究中心副研究員(2002-2003)。 Michael Steinbach 明尼蘇達(dá)大學(xué)計算機(jī)與工程系研究員,在讀博士。 Vipin Kumar 明尼蘇達(dá)大學(xué)計算機(jī)科學(xué)與工程系主任,曾任美國陸軍高性能計算研究中心主任。他擁有馬里蘭大學(xué)博士學(xué)位,是數(shù)據(jù)挖掘和高性能計算方面的國際權(quán)威,IEEE會士。
書籍目錄
1 Introduction 1.1 What Is Data Mining? 1.2 Motivating Challenges 1.3 The Origins of Data Mining 1.4 Data Mining Tasks 1.5 Scope and Organization of the Book 1.6 Bibliographic Notes 1.7 Exercises2 Data 2.1 Types of Data 2.1.1 Attributes and Measurement 2.1.2 Types of Data Sets 2.2 Data Quality 2.2.1 Measurement and Data Collection Issues 2.2.2 Issues Related to Applications 2.3 Data Preprocessing 2.3.1 Aggregation 2.3.2 Sampling 2.3.3 Dimensionality Reduction 2.3.4 Feature Subset Selection 2.3.5 Feature Creation 2.3.6 Discretization and Binarization 2.3.7 Variable Transformation 2.4 Measures of Similarity and Dissimilarity 2.4.1 Basics 2.4.2 Similarity and Dissimilarity between Simple Attributes 2.4.3 Dissimilarities between Data Objects 2.4.4 Similarities between Data Objects 2.4.5 Examples of Proximity Measures 2.4.6 Issues in Proximity Calculation 2.4.7 Selecting the Right Proximity Measure 2.5 Bibliographic Notes 2.6 Exercises……………………………………………
媒體關(guān)注與評論
書評“這是一本全新的數(shù)據(jù)挖掘教材,值得大力推薦?!? ——Jiawei Han,伊利諾伊大學(xué)教授 本書全面介紹了數(shù)據(jù)挖掘,涵蓋了五個主題:數(shù)據(jù)、分類、關(guān)聯(lián)分析、聚類和異常檢測。除異常檢測外,每個主題都有兩章:前一章涵蓋基本概念、代表性算法和評估技術(shù),而后一章討論高級概念和算法。這樣讀者在透徹地理解數(shù)據(jù)挖掘的基礎(chǔ)的同時,還能夠了解更多重要的高級主題。 本書是明尼蘇達(dá)大學(xué)和密歇根州立大學(xué)數(shù)據(jù)挖掘課程的教材,由于獨(dú)具特色,正式出版之前就已經(jīng)被斯坦福大學(xué)、得克薩斯大學(xué)奧斯汀分校等眾多名校采用。 本書特色: ·與許多其他同類圖書不同,本書將重點(diǎn)放在如何用數(shù)據(jù)挖掘知識解決各種實(shí)際問題。 ·只要求具備很少的預(yù)備知識——不需要數(shù)據(jù)庫背景,只需要很少的統(tǒng)計學(xué)或數(shù)學(xué)背景知識。 ·書中包含大量的圖表、綜合示例和豐富的習(xí)題,并且使用示例、關(guān)鍵算法的簡潔描述和習(xí)題,盡可能直接地聚集于數(shù)據(jù)挖掘的主要概念。 ·教輔內(nèi)容極為豐富,包括課程幻燈片、學(xué)生課題建議、數(shù)據(jù)挖掘資源(如數(shù)據(jù)挖掘算法和數(shù)據(jù)集)、聯(lián)機(jī)指南(使用實(shí)際的數(shù)據(jù)集和數(shù)據(jù)分析軟件,為本書介紹的部分?jǐn)?shù)據(jù)挖掘技術(shù)提供例子講解)。 ·為采用本書作為教材的教師提供習(xí)題解答。
編輯推薦
《數(shù)據(jù)挖掘?qū)д摗?英文版)適合作為相關(guān)專業(yè)高年級本科生和研究生數(shù)據(jù)挖掘課程的教材,同時也可作為從事數(shù)據(jù)挖掘研究和應(yīng)用開發(fā)工作的技術(shù)人員的參考書。《數(shù)據(jù)挖掘?qū)д摗?英文版)是明尼蘇達(dá)大學(xué)和密歇根州立大學(xué)數(shù)據(jù)挖掘課程的教材,該書全面介紹了數(shù)據(jù)挖掘,涵蓋了五個主題:數(shù)據(jù)、分類、關(guān)聯(lián)分析、聚類和異常檢測。除異常檢測外,每個主題都有兩章:前一章涵蓋基本概念、代表性算法和評估技術(shù),而后一章討論高級概念和算法。這樣讀者在透徹地理解數(shù)據(jù)挖掘的基礎(chǔ)的同時,還能夠了解更多重要的高級主題。
圖書封面
圖書標(biāo)簽Tags
無
評論、評分、閱讀與下載
數(shù)據(jù)挖掘?qū)д?(英文版) PDF格式下載