數(shù)據(jù)挖掘?qū)д?/h1>
出版時間:2010-12-10  出版社:人民郵電出版社  作者:Pang-Ning Tan,Michael Steinbach,Vipin Kumar  頁數(shù):463  譯者:范明,范宏建  
Tag標(biāo)簽:無  

前言

自從我和孟小峰等人翻譯J. Han和M. Kamber的《數(shù)據(jù)挖掘:概念與技術(shù)》以來,我們高興地看到數(shù)據(jù)挖掘的研究正在我國蓬勃開展。許多學(xué)者和研究人員都對這個新興的學(xué)科領(lǐng)域表現(xiàn)出了極大的興趣,他們之中不僅有來自數(shù)據(jù)庫領(lǐng)域的專家,而且不乏統(tǒng)計學(xué)、人工智能和模式識別、機器學(xué)習(xí)等領(lǐng)域的研究者。國內(nèi)的學(xué)者和研究者在數(shù)據(jù)挖掘方面的研究已經(jīng)取得了一些令人鼓舞的成果,并且正在逐漸與國際學(xué)術(shù)界同步。 數(shù)據(jù)挖掘的產(chǎn)生和發(fā)展一直是分析和理解數(shù)據(jù)的實際需求推動的。數(shù)據(jù)挖掘研究的進(jìn)展也正是在于一直重視與其他領(lǐng)域研究者的合作。數(shù)據(jù)挖掘從工業(yè)、農(nóng)業(yè)、醫(yī)療衛(wèi)生和商業(yè)的需求中獲得動力,從統(tǒng)計學(xué)、機器學(xué)習(xí)等領(lǐng)域的長期研究與發(fā)展中汲取營養(yǎng)。我們相信,只要有理解數(shù)據(jù)的需求,就有推動數(shù)據(jù)挖掘研究與應(yīng)用發(fā)展的動力;只要依靠多學(xué)科的團(tuán)隊,就能應(yīng)對新的數(shù)據(jù)分析任務(wù)帶來的挑戰(zhàn)。 P. Tan、M. Steinbach和V. Kumar編寫的這本《數(shù)據(jù)挖掘?qū)д摗肥抢^《數(shù)據(jù)挖掘:概念與技術(shù)》一書之后的另一本重要的數(shù)據(jù)挖掘著作。三位作者都從事數(shù)據(jù)挖掘研究多年,其中Vipin Kumar教授是數(shù)據(jù)挖掘和高性能計算領(lǐng)域的國際知名學(xué)者。本書原版在正式出版之前就已經(jīng)被斯坦福大學(xué)、得克薩斯大學(xué)奧斯汀分校等眾多名校采用。J. Han教授也高度評價該書:“這是一本全新數(shù)據(jù)挖掘的教材,值得大力推薦。它將成為我們的主要參考書。” 本書不需要讀者具備數(shù)據(jù)庫背景,只需要少量統(tǒng)計學(xué)或數(shù)學(xué)背景知識,而且取材涉及的學(xué)科和應(yīng)用領(lǐng)域較多,實用性強,因此適合的讀者面較廣。本書強調(diào)如何用數(shù)據(jù)挖掘知識解決各種實際問題,強調(diào)所挖掘的知識模式的評估。例如,就像我們能夠從天空中的白云想象出各種動物和物體一樣,每個聚類算法能夠從幾乎所有的數(shù)據(jù)集中發(fā)現(xiàn)聚類。如果數(shù)據(jù)集合中根本不存在自然的簇,所產(chǎn)生的聚類很難說具有實際意義。 全書共分10章。范明負(fù)責(zé)第1~8章的翻譯,范宏建負(fù)責(zé)第9章和第10章的翻譯。蔣宏杰、賈玉祥、許紅濤和溫箐笛也參加本書的最初翻譯工作。全書的譯文由范明負(fù)責(zé)統(tǒng)一定稿。在翻譯的過程中,對發(fā)現(xiàn)的錯誤進(jìn)行了更正,并得到原書作者的確認(rèn)。 感謝P. Tan、M. Steinbach和V. Kumar為中文版撰寫序言。感謝人民郵電出版社圖靈公司的編輯們,他們在第一時間內(nèi)引進(jìn)本書,并組織翻譯,使得中文版能夠如此之快地與讀者見面。

內(nèi)容概要

本書全面介紹了數(shù)據(jù)挖掘的理論和方法,旨在為讀者提供將數(shù)據(jù)挖掘應(yīng)用于實際問題所必需的知識。本書涵蓋五個主題:數(shù)據(jù)、分類、關(guān)聯(lián)分析、聚類和異常檢測。除異常檢測外,每個主題都包含兩章:前面一章講述基本概念、代表性算法和評估技術(shù),后面一章較深入地討論高級概念和算法。目的是使讀者在透徹地理解數(shù)據(jù)挖掘基礎(chǔ)的同時,還能了解更多重要的高級主題。此外,書中還提供了大量示例、圖表和習(xí)題?! ”緯m合作為相關(guān)專業(yè)高年級本科生和研究生數(shù)據(jù)挖掘課程的教材,同時也可作為數(shù)據(jù)挖掘研究和應(yīng)用開發(fā)人員的參考書。

作者簡介

陳封能(Pang-Ning Tan)現(xiàn)為密歇根州立大學(xué)計算機與工程系助理教授,主要教授數(shù)據(jù)挖掘、數(shù)據(jù)庫系統(tǒng)等課程。此前,他曾是明尼蘇達(dá)大學(xué)美國陸軍高性能計算研究中心副研究員(2002-2003)。
  斯坦巴赫(Michael Steinbach)明尼蘇達(dá)大學(xué)計算機與工程系研究員,在讀博士。
  庫瑪爾(Vipin Kumar)明尼蘇達(dá)大學(xué)計算機科學(xué)與工程系主任,曾任美國陸軍高性能計算研究中心主任。他擁有馬里蘭大學(xué)博士學(xué)位,是數(shù)據(jù)挖掘和高性能計算方面的國際權(quán)威,IEEE會士。
  范明,鄭州大學(xué)信息工程學(xué)院教授,中國計算機學(xué)會數(shù)據(jù)庫專業(yè)委員會委員、人工智能與模式識別專業(yè)委員會委員,長期從事計算機軟件與理論教學(xué)和研究。先后發(fā)表論史40余篇。
  范宏建 澳大利亞墨爾本大學(xué)計算機科學(xué)博士。先后在WWW、PAKDD、RSFDGrC、IEEE GrC和Australian AI等國際學(xué)術(shù)會議和IEEE Transactions on Knowledge and Data Engineering發(fā)表論文10余篇。目前是澳大利亞AUSTRAC的高級分析師。

書籍目錄

第1章 緒論  1.1 什么是數(shù)據(jù)挖掘  1.2 數(shù)據(jù)挖掘要解決的問題  1.3 數(shù)據(jù)挖掘的起源  1.4 數(shù)據(jù)挖掘任務(wù)  1.5 本書的內(nèi)容與組織   文獻(xiàn)注釋  參考文獻(xiàn)  習(xí)題 第2章 數(shù)據(jù)  2.1 數(shù)據(jù)類型   2.1.1 屬性與度量   2.1.2 數(shù)據(jù)集的類型  2.2 數(shù)據(jù)質(zhì)量   2.2.1 測量和數(shù)據(jù)收集問題   2.2.2 關(guān)于應(yīng)用的問題  2.3 數(shù)據(jù)預(yù)處理   2.3.1 聚集   2.3.2 抽樣    2.3.3 維歸約   2.3.4 特征子集選擇    2.3.5 特征創(chuàng)建   2.3.6 離散化和二元化    2.3.7 變量變換   2.4 相似性和相異性的度量   2.4.1 基礎(chǔ)    2.4.2 簡單屬性之間的相似度和相異度   2.4.3 數(shù)據(jù)對象之間的相異度   2.4.4 數(shù)據(jù)對象之間的相似度   2.4.5 鄰近性度量的例子   2.4.6 鄰近度計算問題    2.4.7 選取正確的鄰近性度量  文獻(xiàn)注釋  參考文獻(xiàn)   習(xí)題 第3章 探索數(shù)據(jù)  第4章 分類:基本概念、決策樹與模型評估 第5章 分類:其他技術(shù) 第6章 關(guān)聯(lián)分析:基本概念和算法 第7章 關(guān)聯(lián)分析:高級概念 第8章 聚類分析:基本概念和算法 第9章 聚類分析:其他問題與算法  第10章 異常檢測 文獻(xiàn)注釋 參考文獻(xiàn)  習(xí)題 附錄a 線性代數(shù) 附錄b 維歸約  附錄c 概率統(tǒng)計 附錄d 回歸  附錄e 優(yōu)化

章節(jié)摘錄

插圖:空間數(shù)據(jù)的重要例子是科學(xué)和工程數(shù)據(jù)集,其數(shù)據(jù)取自二維或三維網(wǎng)格上規(guī)則或不規(guī)則分布的點上的測量或模型輸出。例如,地球科學(xué)數(shù)據(jù)集記錄在各種分辨率(如每度)下經(jīng)緯度球面網(wǎng)格點(網(wǎng)格單元)上測量的溫度和氣壓(見圖2-4d)。另一個例子,在瓦斯氣流模擬中,可以針對模擬中的每個網(wǎng)格點記錄流速和方向。5.處理非記錄數(shù)據(jù)大部分?jǐn)?shù)據(jù)挖掘算法都是為記錄數(shù)據(jù)或其變體(如事務(wù)數(shù)據(jù)和數(shù)據(jù)矩陣)設(shè)計的。通過從數(shù)據(jù)對象中提取特征,并使用這些特征創(chuàng)建對應(yīng)于每個對象的記錄,針對記錄數(shù)據(jù)的技術(shù)也可以用于非記錄數(shù)據(jù)??紤]前面介紹的化學(xué)結(jié)構(gòu)數(shù)據(jù)。給定一個常見的子結(jié)構(gòu)集合,每個化合物都可以用一個具有二元屬性的記錄表示,這些二元屬性指出化合物是否包含特定的子結(jié)構(gòu)。這樣的表示實際上是事務(wù)數(shù)據(jù)集,其中事務(wù)是化合物,而項是子結(jié)構(gòu)。在某些情況下,容易用記錄形式表示數(shù)據(jù),但是這類表示并不能捕獲數(shù)據(jù)中的所有信息??紤]這樣的時間空間數(shù)據(jù),它由空間網(wǎng)格每一點上的時間序列組成。通常,這種數(shù)據(jù)存放在數(shù)據(jù)矩陣中,其中每行代表一個位置,而每列代表一個特定的時間點。然而,這種表示并不能明確地表示屬性之間存在的時間聯(lián)系以及對象之間存在的空間聯(lián)系。但并不是說這種表示不合適,而是說分析時必須考慮這些聯(lián)系。例如,在使用數(shù)據(jù)挖掘技術(shù)時,假定屬性之間在統(tǒng)計上是相互獨立的并不是一個好主意。

編輯推薦

《數(shù)據(jù)挖掘?qū)д?完整版)》是明尼蘇達(dá)大學(xué)和密歇根州立大學(xué)數(shù)據(jù)挖掘課程的教材,由于獨具特色,正式出版之前就已經(jīng)被斯坦福大學(xué)、得克薩斯大學(xué)奧斯汀分校等眾多名校采用?!稊?shù)據(jù)挖掘?qū)д?完整版)》與許多其他同類圖書不同,《數(shù)據(jù)挖掘?qū)д?完整版)》將重點放在如何用數(shù)據(jù)挖掘知識解決各種實際問題。只要求具備很少的預(yù)備知識——不需要數(shù)據(jù)庫背景,只需要很少的統(tǒng)計學(xué)或數(shù)學(xué)背景知識?!稊?shù)據(jù)挖掘?qū)д?完整版)》中包含大量的圖表、綜合示例和豐富的習(xí)題,并且使用示例、關(guān)鍵算法的簡潔描述和習(xí)題,盡可能直接聚焦于數(shù)據(jù)挖掘的主要概念。教輔內(nèi)容極為豐富,包括課程幻燈片、學(xué)生課題建議、數(shù)據(jù)挖掘資源(如數(shù)據(jù)挖掘算法和數(shù)據(jù)集)、聯(lián)機指南(使用實際的數(shù)據(jù)集和數(shù)據(jù)分析軟件,《數(shù)據(jù)挖掘?qū)д?完整版)》介紹的部分?jǐn)?shù)據(jù)挖掘技術(shù)提供例子講解)。

圖書封面

圖書標(biāo)簽Tags

評論、評分、閱讀與下載


    數(shù)據(jù)挖掘?qū)д?PDF格式下載


用戶評論 (總計141條)

 
 

  •   《數(shù)據(jù)挖掘?qū)д?完整版)》是明尼蘇達(dá)大學(xué)和密歇根州立大學(xué)數(shù)據(jù)挖掘課程的教材,由于獨具特色,正式出版之前就已經(jīng)被斯坦福大學(xué)、得克薩斯大學(xué)奧斯汀分校等眾多名校采用。很好的書。
  •   開學(xué)時買的書,一個學(xué)期的學(xué)習(xí)覺得這本書非常適合初學(xué)者。內(nèi)容注重概念的理解,弱化了數(shù)學(xué)推理的過程,對于數(shù)據(jù)挖掘中的基本概念如分類和聚類等都解釋的通俗易懂。
  •   數(shù)據(jù)挖掘上學(xué)時沒認(rèn)真聽,弄到工作了,需要用到數(shù)據(jù)挖掘了,還要自己去自學(xué),于是就買一本導(dǎo)論,基礎(chǔ)一點的,這樣容易上手,往后再買進(jìn)階的書籍。現(xiàn)在剛收到書,還沒仔細(xì)看,但估計書的內(nèi)容不會差到哪里去的。好好學(xué)習(xí)?。。?/li>
  •   書不錯,紙質(zhì)也不錯,比一起買的《數(shù)據(jù)挖掘概念與技術(shù)(原書第2版)》紙質(zhì)好多了。
  •   國外很多大學(xué)用這本書作教材。本人讀過好多本數(shù)據(jù)挖掘方面的書,個人感覺這本比較適合入門,且相關(guān)內(nèi)容解釋得恰到好處,既非長篇大論,亦非偷懶引用,可見作者功力非凡。
  •   內(nèi)容詳實,對數(shù)據(jù)挖掘的概念介紹的很清楚
  •   別看什么《數(shù)據(jù)挖掘 概念與技術(shù)》了
  •   這是一本系統(tǒng)性地介紹數(shù)據(jù)挖掘理論與技術(shù)的圖書,非常適合入門到潛心鉆研的人士。
  •   書不錯,紙張很好。就是送書的時候沒包裝,導(dǎo)致書腳那塊壞了一點。這個核另外一本《數(shù)據(jù)挖掘概念》都不錯。
  •   比較適合想對數(shù)據(jù)挖掘進(jìn)行較深入研究了解的人士。
  •   多方位介紹了數(shù)據(jù)挖掘知識,入門必讀。。
  •   數(shù)據(jù)挖掘系列叢書中質(zhì)量不錯的書,值得購買
  •   從知乎知道的這本書,目前在做數(shù)據(jù)分析 ,但是想從事數(shù)據(jù)倉庫或挖掘可看,非常經(jīng)典
  •   學(xué)習(xí)數(shù)據(jù)挖掘的童鞋都應(yīng)該人手一本,這邊書算是介紹得比較深入淺出
  •   學(xué)數(shù)據(jù)挖掘的必備教程,理論知識很充足
  •   書非常好 龍星計劃數(shù)據(jù)挖掘的推薦用書
  •   經(jīng)典的數(shù)據(jù)挖掘技術(shù)寶典,理論性非常強,知識面也很廣
  •   適合對數(shù)據(jù)挖掘有興趣的零基礎(chǔ)的朋友
  •   一本非常好的數(shù)據(jù)挖掘書籍。 不僅適合初學(xué)者,對已經(jīng)在行業(yè)工作的人也非常有幫助。行文流暢,翻譯的也很不錯。
  •   想了解下 數(shù)據(jù)挖掘 方面的東西,得好好讀讀了!
  •   數(shù)據(jù)挖掘中的好書,有點難度,對數(shù)學(xué)要求高
  •   這是一本比較經(jīng)典的數(shù)據(jù)挖掘的書了吧,感覺很不錯!
  •   很不錯的書,做數(shù)據(jù)挖掘一定要看
  •   書不錯,翻譯的非常不錯。質(zhì)量也不錯,是學(xué)數(shù)據(jù)挖掘的好書。。。
  •   學(xué)數(shù)據(jù)挖掘必看的書
  •   數(shù)據(jù)挖掘方面的入門書~
  •   作為初學(xué)數(shù)據(jù)挖掘的人來說是蠻不錯的一本書
  •   這本書很不錯,學(xué)習(xí)一下數(shù)據(jù)挖掘。
  •   數(shù)據(jù)挖掘領(lǐng)域不錯的一本書
  •   深入淺出,適合剛接觸數(shù)據(jù)挖掘的人
  •   這是一本十分經(jīng)典數(shù)據(jù)挖掘書籍
  •   數(shù)據(jù)挖掘必備
  •   我以為就是一些商業(yè)數(shù)據(jù)的分析。結(jié)果里面涉及到數(shù)據(jù)庫,數(shù)據(jù)結(jié)構(gòu),等更深的一些算法的東西,俺還消化不了,
  •   書的質(zhì)量不錯,送貨也很快,可是使用10元優(yōu)惠券后居然沒有找到發(fā)票?
    早就知道這本書,需要了解更多數(shù)據(jù)挖掘,買來看,應(yīng)該能有幫助。就是不知道里面一些數(shù)學(xué)的、計算機的知識能否理解。努力!
  •   大數(shù)據(jù)是當(dāng)前比較熱的前沿話題。如何研究和熟悉此類這些書是不錯的
  •   還沒讀,感覺不錯,對數(shù)據(jù)分析有幫助
  •   理論加實戰(zhàn)的書都是好書。里面以論文和示例的形式闡述推薦算法,對實戰(zhàn)有很好的指導(dǎo)意義
  •   書很好,講得透徹,能實際使用,比那本《概念與技術(shù)》要實用得多。
  •   書收到了,服務(wù)態(tài)度很好,書的質(zhì)量也很好,內(nèi)容挺符合我的需求,對算法描述的很多,總之,很滿意
  •   書的質(zhì)量很好,東西很全面。內(nèi)容還算比較新。算是導(dǎo)論吧!
  •   今天送到了,不愧是當(dāng)當(dāng),送貨速度很快啊,而且送貨員態(tài)度還很好,很滿意,收到之后大致翻著看了一下,應(yīng)該是很不錯的一本書,圖文并茂的,而且講的內(nèi)容很多,很全面,但是看到了很多的數(shù)學(xué)公式,唉!對數(shù)學(xué)不感冒啊,真擔(dān)心后面看起來效果會如何!但是書是好書,這點不容置疑!
  •   看得出是位認(rèn)真的作者,每一章結(jié)尾有超多外文參考文獻(xiàn)。作為研究生的入門教材不錯
  •   作為初學(xué)者,看這本書實在是太好了,給我奠定了這門課很多的基本概念,對學(xué)習(xí)很有幫助!
  •   這本書介紹的知識比較廣泛
  •   真是我們學(xué)校的研究生教材,老師推薦的。的確很好。
  •   我研究生導(dǎo)師推薦讀的書,很不錯哦
  •   對于專業(yè)人士可以研究研究非專業(yè)的只能了解
  •   比較深奧的書,需要花時間看
  •   這本書不需要說太多,大家都懂的.
  •   講原理和簡單應(yīng)用,適合我這種初學(xué)者
  •   很不錯,老師推薦的教材,摸起來紙質(zhì)非常好,很有看的欲望!
  •   老師推薦的教材~中文版挺不錯的~就是價格略高~
  •   由于要做畢業(yè)設(shè)計買的書,據(jù)說是很不錯的教材,特地買回來看的。剛拿到手,很厚,400多頁,印刷很不錯。會好好看的。
  •   有用,不過對于沒有數(shù)學(xué)基礎(chǔ)的,確實難了!
  •   不錯, 紙質(zhì)厚實,摸起來感覺很舒服,具有一定的數(shù)學(xué)數(shù)學(xué)基礎(chǔ)的人讀起來會更容易一些。
  •   這本書是上課時用的自己充電的補充教材。
  •   不錯,圖書管里的書,都借走了,只好來買了,不過這么好的書也應(yīng)該有自己的一本
  •   到貨很快,書的質(zhì)量很好,是正版,我在當(dāng)當(dāng)上買這本書比亞馬遜上便宜,很開心!
  •   質(zhì)量很棒,更重要的是,內(nèi)容很好!
  •   少有的資料類書籍
  •   介紹很詳實,有一定的難度,堅持看完會有收獲,送貨速度快!
  •   感覺內(nèi)容比較全面
  •   幫老公買的,書的質(zhì)量不錯,他說挺專業(yè)的,有用
  •   書挺好,就是書在運送過程中被磕壞了,皺了
  •   紙質(zhì)好,內(nèi)容好。老師推薦的
  •   老師上課的教材,內(nèi)容易懂,翻譯的也不錯。對于初學(xué)者和研究者都是很好的教材。
  •   發(fā)貨速度還是一如既往的快,書的質(zhì)量不錯,就是封皮設(shè)計的不喜歡。內(nèi)容肯定沒的說,趕緊啃書了~~~
  •   書印刷和紙張都很好,內(nèi)容還要細(xì)看
  •   書的味道有點重,內(nèi)容沒仔細(xì)看,不過感覺很全,但是不夠詳細(xì)
  •   內(nèi)容挺細(xì)致的,書的質(zhì)量也不粗
  •   書的內(nèi)容不錯,紙質(zhì)也好,當(dāng)當(dāng)買書感覺持續(xù)良好
  •   挺好,挺全面
  •   非常好送貨快,推薦大家
  •   上課要用,老師指定教材。就買唄。好壞不評論。
  •   指定教材~ 快遞速度不錯~
  •   一本有全局視野的入門型好書。即便是入門型,其提到的數(shù)學(xué)也足以讓人對數(shù)學(xué)充滿了敬意
  •   很好哦。下次買書就在這啦。
  •   書有一點難,但是質(zhì)量很好,紙張很厚
  •   書不錯 質(zhì)量什么的都很滿意
  •   新手接觸,還不知道能接受到什么程度,但是書的目錄和質(zhì)量感覺都不錯
  •   書紙質(zhì)真好,看上去就特有質(zhì)感。。。喜歡,嘿嘿
  •   書是正品,質(zhì)量非常好
  •   書質(zhì)量不錯。。。,看了一部分了,挺好的
  •   大牛寫的書,非常好。正在讀。
  •   書的翻譯質(zhì)量很好,看得出來譯者是行家。淺顯易懂。
  •   書挺好的!送貨速度也很快!
  •   淺顯易讀,循序漸進(jìn),翻譯得也不錯。可讀性很強。是一本不錯的書。
  •   書時好書,但貌似看不太懂,對我來說有點深奧了!
  •   第一次在當(dāng)當(dāng)上買書,感覺不錯!
  •   買來看看,對這方面比較有興趣,書不錯,不是很枯燥。
  •   質(zhì)量不錯,是我要的書~很棒!
  •   書很好很正版,服務(wù)很貼心,以后會再來的
  •   人很好,書也很好,收藏。
  •   書還是很不錯的,基于要有一定的水平才能讀懂,請書友們慎重!
  •   很不錯,已經(jīng)在看了呢~
  •   給同事買的,同事反饋不錯,很值的閱讀的一本書。
  •   這本書很不錯,很實用。當(dāng)當(dāng)價格很優(yōu)惠
  •   本書邏輯體系嚴(yán)密,比較細(xì)致
  •   挺好的一本書,正在看
  •   是老師讓買的,但是這本書是講什么的以前沒有接觸。
 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7