數(shù)據(jù)挖掘?qū)д?(英文版)

出版時間:2006-1  出版社:人民郵電出版社  作者:[美] Pang-Ning Tan,Michael Steinbach,Vipin Kumar 著  頁數(shù):516  
Tag標簽:無  

內(nèi)容概要

  本書對數(shù)據(jù)挖掘進行了全面介紹,旨在為讀者提供將數(shù)據(jù)挖掘應用于實際問題所必需的知識。本書涵蓋五個主題:數(shù)據(jù)、分類、關聯(lián)分析、聚類和異常檢測。除異常檢測外,每個主題都有兩章:前面一章講述基本概念、代表性算法和評估技術,而后面一章較深入地討論高級概念和算法。目的是在使讀者透徹地理解數(shù)據(jù)挖掘基礎的同時,還能了解更多重要的高級主題。此外,書中還提供了大量例子、圖表和習題?! ”緯m合作為相關專業(yè)高年級本科生和研究生數(shù)據(jù)挖掘課程的教材,同時也可作為從事數(shù)據(jù)挖掘研究和應用開發(fā)工作的技術人員的參考書。

作者簡介

作者:(美)譚Pang-Ning Tan 現(xiàn)為密歇根州立大學計算機與工程系助理教授,主要教授數(shù)據(jù)挖掘、數(shù)據(jù)庫系統(tǒng)等課程。此前,他曾是明尼蘇達大學美國陸軍高性能計算研究中心副研究員(2002-2003)。    Michael Steinbach 明尼蘇達大學計算機與工程系研究員,在讀博士。    Vipin Kumar 明尼蘇達大學計算機科學與工程系主任,曾任美國陸軍高性能計算研究中心主任。他擁有馬里蘭大學博士學位,是數(shù)據(jù)挖掘和高性能計算方面的國際權威,IEEE會士。

書籍目錄

1 Introduction   1.1 What Is Data Mining?   1.2 Motivating Challenges   1.3 The Origins of Data Mining   1.4 Data Mining Tasks   1.5 Scope and Organization of the Book   1.6 Bibliographic Notes   1.7 Exercises2 Data   2.1 Types of Data         2.1.1 Attributes and Measurement         2.1.2 Types of Data Sets   2.2 Data Quality         2.2.1 Measurement and Data Collection Issues         2.2.2 Issues Related to Applications   2.3 Data Preprocessing         2.3.1 Aggregation         2.3.2 Sampling         2.3.3 Dimensionality Reduction         2.3.4 Feature Subset Selection         2.3.5 Feature Creation         2.3.6 Discretization and Binarization         2.3.7 Variable Transformation   2.4 Measures of Similarity and Dissimilarity         2.4.1 Basics         2.4.2 Similarity and Dissimilarity between Simple Attributes        2.4.3 Dissimilarities between Data Objects        2.4.4 Similarities between Data Objects        2.4.5 Examples of Proximity Measures        2.4.6 Issues in Proximity Calculation        2.4.7 Selecting the Right Proximity Measure  2.5 Bibliographic Notes  2.6 Exercises……………………………………………

媒體關注與評論

書評“這是一本全新的數(shù)據(jù)挖掘教材,值得大力推薦。”                     ——Jiawei Han,伊利諾伊大學教授    本書全面介紹了數(shù)據(jù)挖掘,涵蓋了五個主題:數(shù)據(jù)、分類、關聯(lián)分析、聚類和異常檢測。除異常檢測外,每個主題都有兩章:前一章涵蓋基本概念、代表性算法和評估技術,而后一章討論高級概念和算法。這樣讀者在透徹地理解數(shù)據(jù)挖掘的基礎的同時,還能夠了解更多重要的高級主題。    本書是明尼蘇達大學和密歇根州立大學數(shù)據(jù)挖掘課程的教材,由于獨具特色,正式出版之前就已經(jīng)被斯坦福大學、得克薩斯大學奧斯汀分校等眾多名校采用。    本書特色:    ·與許多其他同類圖書不同,本書將重點放在如何用數(shù)據(jù)挖掘知識解決各種實際問題。    ·只要求具備很少的預備知識——不需要數(shù)據(jù)庫背景,只需要很少的統(tǒng)計學或數(shù)學背景知識。    ·書中包含大量的圖表、綜合示例和豐富的習題,并且使用示例、關鍵算法的簡潔描述和習題,盡可能直接地聚集于數(shù)據(jù)挖掘的主要概念。    ·教輔內(nèi)容極為豐富,包括課程幻燈片、學生課題建議、數(shù)據(jù)挖掘資源(如數(shù)據(jù)挖掘算法和數(shù)據(jù)集)、聯(lián)機指南(使用實際的數(shù)據(jù)集和數(shù)據(jù)分析軟件,為本書介紹的部分數(shù)據(jù)挖掘技術提供例子講解)。    ·為采用本書作為教材的教師提供習題解答。

編輯推薦

《數(shù)據(jù)挖掘?qū)д摗?英文版)適合作為相關專業(yè)高年級本科生和研究生數(shù)據(jù)挖掘課程的教材,同時也可作為從事數(shù)據(jù)挖掘研究和應用開發(fā)工作的技術人員的參考書?!稊?shù)據(jù)挖掘?qū)д摗?英文版)是明尼蘇達大學和密歇根州立大學數(shù)據(jù)挖掘課程的教材,該書全面介紹了數(shù)據(jù)挖掘,涵蓋了五個主題:數(shù)據(jù)、分類、關聯(lián)分析、聚類和異常檢測。除異常檢測外,每個主題都有兩章:前一章涵蓋基本概念、代表性算法和評估技術,而后一章討論高級概念和算法。這樣讀者在透徹地理解數(shù)據(jù)挖掘的基礎的同時,還能夠了解更多重要的高級主題。

圖書封面

圖書標簽Tags

評論、評分、閱讀與下載


    數(shù)據(jù)挖掘?qū)д?(英文版) PDF格式下載


用戶評論 (總計3條)

 
 

  •   這本書進的非常簡單易懂,而且講的非常全面,非常詳細。我上的《數(shù)據(jù)挖掘》這門課,上課基本沒聽,基本靠看這本書。感覺對數(shù)據(jù)挖掘的基本概念已經(jīng)了解了
  •   送貨比較快。書的紙質(zhì)還不錯,挺滿意。以后多一點英文影印版的書就好了啊。
  •   書是很經(jīng)典的書翻版過來的,就是紙質(zhì)不是很好,總的來說還不錯
 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7