出版時間:2012-3 出版社:機械工業(yè)出版社 作者:(美)Jiawei Han,(加)Micheline Kamber,(加)Jian Pei 頁數(shù):703
Tag標簽:無
內(nèi)容概要
當代商業(yè)和科學領(lǐng)域大量激增的數(shù)據(jù)量要求我們采用更加復雜和精細的工具來進行數(shù)據(jù)分析、處理和挖掘。盡管近年來數(shù)據(jù)挖掘技術(shù)取得的長足進展使得我們廣泛收集數(shù)據(jù)越來越容易,但技術(shù)的發(fā)展依然難以匹配爆炸性的數(shù)據(jù)增長以及隨之而來的大量數(shù)據(jù)處理需求,因此我們比以往更加迫切地需要新技術(shù)和自動化工具來幫助我們將這些數(shù)據(jù)轉(zhuǎn)換為有用的信息和知識。
本書前版曾被KDnuggets的讀者評選為最受歡迎的數(shù)據(jù)挖掘?qū)V?,是一本可讀性極佳的教材。它從數(shù)據(jù)庫角度全面系統(tǒng)地介紹數(shù)據(jù)挖掘的概念、方法和技術(shù)以及技術(shù)研究進展,并重點關(guān)注近年來該領(lǐng)域重要和最新的課題——數(shù)據(jù)倉庫和數(shù)據(jù)立方體技術(shù),流數(shù)據(jù)挖掘,社會化網(wǎng)絡(luò)挖掘,空間、多媒體和其他復雜數(shù)據(jù)挖掘。每章都針對關(guān)鍵專題有單獨的指導,提供最佳算法,并對怎樣將技術(shù)運用到實際工作中給出了經(jīng)過實踐檢驗的實用型規(guī)則。如果你希望自己能熟練掌握和運用當今最有力的數(shù)據(jù)挖掘技術(shù),那這本書正是你需要閱讀和學習的寶貴資源。本書是數(shù)據(jù)挖掘和知識發(fā)現(xiàn)領(lǐng)域內(nèi)的所有教師、研究人員、開發(fā)人員和用戶都必讀的一本書。
本書特點
引入了許多算法和實現(xiàn)示例,全部以易于理解的偽代碼編寫,適用于實際的大規(guī)模數(shù)據(jù)挖掘項目。
討論了一些高級主題,例如挖掘面向?qū)ο蟮年P(guān)系型數(shù)據(jù)庫、空間數(shù)據(jù)庫、多媒體數(shù)據(jù)庫、時間序列數(shù)據(jù)庫、文本數(shù)據(jù)庫、萬維網(wǎng)以及其他領(lǐng)域的應(yīng)用等。
全面而實用地給出用于從海量數(shù)據(jù)中獲取盡可能多信息的概念和技術(shù)?! ?/pre>作者簡介
Jiawei Han(韓家煒) 伊利諾伊大學厄巴納-尚佩恩分校計算機科學系A(chǔ)bel
Bliss教授。由于在數(shù)據(jù)挖掘和數(shù)據(jù)庫系統(tǒng)領(lǐng)域卓有成效的研究工作,他曾多次獲得各種榮譽和獎勵,其中包括2004年ACM
SIGKDD頒發(fā)的最佳創(chuàng)新獎,2005年IEEE Computer Society 頒發(fā)的技術(shù)成就獎,2009年IEEE頒發(fā)的W.
Wallace McDowell獎。他是ACM和IEEE Fellow,同時還是《ACM Transactions on
Knowledge Discovery from Data》雜志的主編(2006-2011),以及《IEEE Transactions
on Knowledge and Data Engineering》和《Data Mining and Knowledge
Discovery》雜志的編委會成員。
Micheline Kamber 擁有加拿大康考迪亞大學計算機科學碩士學位,她是NSERC
Scholar,現(xiàn)在加拿大麥吉爾大學、西蒙-弗雷澤大學及瑞士從事研究工作。
Jian Pei(裴健) 目前是加拿大西蒙-弗雷澤大學計算機學院副教授。2002年,他在Jia wei
Han教授的指導下獲得西蒙-弗雷澤大學博士學位。書籍目錄
Foreword to Second Edition
Preface
Acknowledgments
About the Authors
Chapter 1 Introduction
Chapter 2 Getting to Know Your Data
Chapter 3 Data Preprocessing
Chapter 4 Data Warehousing and Online Analytical
Processin
Chapter 5 Data Cube Technology
Chapter 6 Mining Frequent Patterns, Associations, and Correlations:
Basic Concepts and Methods
Chapter 7 Advanced Pattern Mining
Chapter 8 Classification: Basic Concepts
Chapter 9 Classification: Advanced Methods
Chapter 10 Cluster Analysis: Basic Concepts and I~ethods
Chapter 11 Advanced Cluster Analysis
Chapter 12 Outlier Detection
Chapter 13 Data Mining Trends and Research Frontiers
Bibliography
Index章節(jié)摘錄
版權(quán)頁:插圖:媒體關(guān)注與評論
我們生活在數(shù)據(jù)洪流的時代。本書向我們展示了如何從這樣海量的數(shù)據(jù)中找到有用知識的方法和技術(shù)。最新的第3版顯著擴充了數(shù)據(jù)預(yù)處理、挖掘頻繁模式、分類和聚類這幾個核心章節(jié)的內(nèi)容;還全面講述了OLAP和離群點檢測,并研討了挖掘網(wǎng)絡(luò)、復雜數(shù)據(jù)類型以及重要應(yīng)用領(lǐng)域。本書將是一本適用于數(shù)據(jù)分析、數(shù)據(jù)挖掘和知識發(fā)現(xiàn)課程的優(yōu)秀教材。 —— Gregory Piatetsky-Shapiro, KDnuggets的總裁 Jiawei、Micheline和Jian的教材全景式地討論了數(shù)據(jù)挖掘的所有相關(guān)方法,從聚類和分類的經(jīng)典主題,到數(shù)據(jù)庫方法(關(guān)聯(lián)規(guī)則、數(shù)據(jù)立方體),到更新和更高級的主題(SVD/PCA、小波、支持向量機),等等??偟恼f來,這是一本既講述經(jīng)典數(shù)據(jù)挖掘方法又涵蓋大量當代數(shù)據(jù)挖掘技術(shù)的優(yōu)秀著作,既是教學相長的優(yōu)秀教材,又對專業(yè)人員具有很高的參考價值。 —— 摘自卡內(nèi)基-梅隆大學Christos Faloutsos教授為本書所作序言編輯推薦
《數(shù)據(jù)挖掘:概念與技術(shù)(英文版?第3版)》最完整、最全面地講述了數(shù)據(jù)挖掘領(lǐng)域的重要知識和技術(shù)創(chuàng)新。相比內(nèi)容已經(jīng)相當全面的第1版,第2版展示了該領(lǐng)域的最新研究成果,例如挖掘流、時序數(shù)據(jù)和序列數(shù)據(jù)以及挖掘空間、多媒體、文本和IWeb數(shù)據(jù)?!稊?shù)據(jù)挖掘:概念與技術(shù)(英文版?第3版)》是數(shù)據(jù)挖掘和知識發(fā)現(xiàn)領(lǐng)域內(nèi)所有教師、研究人員、開發(fā)人員和用戶部必讀的一本書。圖書封面
圖書標簽Tags
無評論、評分、閱讀與下載