數(shù)據(jù)挖掘

出版時間:2005-9  出版社:機械工業(yè)出版社  作者:威滕  頁數(shù):524  
Tag標簽:無  

內(nèi)容概要

本書對1999年的初版做了重大的改動。雖說核心概念沒有變化,但本書進行了更新使其能反映過去5年里的變化,參考文獻幾乎翻了一番。新版的重要部分包括:30個新的技術(shù)章節(jié);一個加強了的具有交互式界面的Weka機器學習工作平臺;有關(guān)神經(jīng)網(wǎng)絡(luò)的完整信息,一個有關(guān)貝葉斯網(wǎng)絡(luò)的新節(jié);等等?! ”緯峁┝藱C器學習概念的完整基礎(chǔ),此外還針對實際工作中應(yīng)用相關(guān)工具和技術(shù)提出了一些建議,在本書中你將發(fā)現(xiàn):   ●成功數(shù)據(jù)挖掘技術(shù)的核心算法,包括歷經(jīng)考驗的真實技術(shù)及前沿的方法。   ●轉(zhuǎn)換輸入或輸出以改善性能的方法?!  窨上螺d的Weka軟件??一個用于數(shù)據(jù)挖掘任務(wù)的機器學習算法的集合,包括用于數(shù)據(jù)預(yù)處理、分類、回歸、聚類、關(guān)聯(lián)規(guī)則以及在新的交互式界面上可視化的工具。

作者簡介

Lan H.Witten新西蘭懷卡托大學計算機科學系教授,ACM和新西蘭皇家學會成員。他曾榮獲2004年國際信息處理研究聯(lián)合會頒發(fā)的Namur獎項,這是一個兩年一度的榮譽獎項,用于獎勵那些在信息和通信技術(shù)的社會應(yīng)用方面做出杰現(xiàn)貢獻及具有國際影響的人。他的著作包括《Managing Gi

書籍目錄

ForewordPrefacePart I Machine learning tools and techniques 1. What?s it all about?   1.1 Data mining and machine learning   1.2 Simple examples: the weather problem and others   1.3 Fielded applications   1.4 Machine learning and statistics   1.5 Generalization as search   1.6 Data mining and ethics   1.7 Further reading  2. Input: Concepts, instances, attributes   2.1 What?s a concept?   2.2 What?s in an example?  2.3 What?s in an attribute?   2.4 Preparing the input   2.5 Further reading  3. Output: Knowledge representation   3.1 Decision tables   3.2 Decision trees   3.3 Classification rules   3.4 Association rules   3.5 Rules with exceptions   3.6 Rules involving relations  3.7 Trees for numeric prediction   3.8 Instance-based representation   3.9 Clusters   3.10 Further reading  4. Algorithms: The basic methods   4.1 Inferring rudimentary rules   4.2 Statistical modeling   4.3 Divide-and-conquer: constructing decision trees   4.4 Covering algorithms: constructing rules   4.5 Mining association rules   4.6 Linear models   4.7 Instance-based learning   4.8 Clustering   4.9 Further reading  5. Credibility: Evaluating what?s been learned   5.1 Training and testing   5.2 Predicting performance   5.3 Cross-validation   5.4 Other estimates   5.5 Comparing data mining schemes   5.6 Predicting probabilities   5.7 Counting the cost   5.8 Evaluating numeric prediction   5.9 The minimum description length principle   5.10 Applying MDL to clustering   5.11 Further reading  6. Implementations: Real machine learning schemes   6.1 Decision trees   6.2 Classification rules   6.3 Extending linear models   6.4 Instance-based learning   6.5 Numeric prediction   6.6 Clustering   6.7 Bayesian networks  7. Transformations: Engineering the input and output   7.1 Attribute selection   7.2 Discretizing numeric attributes   7.3 Some useful transformations   7.4 Automatic data cleansing   7.5 Combining multiple models   7.6 Using unlabeled data   7.7 Further reading  8. Moving on: Extensions and applications   8.1 Learning from massive datasets   8.2 Incorporating domain knowledge   8.3 Text and Web mining   8.4 Adversarial situations   8.5 Ubiquitous data mining   8.6 Further reading Part II: The Weka machine learning workbench  9. Introduction to Weka   9.1 What?s in Weka?   9.2 How do you use it?   9.3 What else can you do?  9.4 How do you get it?  10. The Explorer   10.1 Getting started   10.2 Exploring the Explorer   10.3 Filtering algorithms   10.4 Learning algorithms   10.5 Meta-learning algorithms   10.6 Clustering algorithms   10.7 Association-rule learners   10.8 Attribute selection  11. The Knowledge Flow interface   11.1 Getting started   11.2 Knowledge Flow components   11.3 Configuring and connecting the components   11.4 Incremental learning  12. The Experimenter   12.1 Getting started   12.2 Simple setup   12.3 Advanced setup   12.4 The Analyze panel  12.5 Distributing processing over several machines  13. The command-line interface   13.1 Getting started   13.2 The structure of Weka   13.3 Command-line options  14. Embedded machine learning …… 15. Writing new learning schemes References Index

圖書封面

圖書標簽Tags

評論、評分、閱讀與下載


    數(shù)據(jù)挖掘 PDF格式下載


用戶評論 (總計34條)

 
 

  •   是我們machinelearninganddatamining的教材之一,不過這本書是圍繞weka的,TomMitchell的MachineLearning是理論為主的。要做算法的implementation的時候,用這本書很好
  •   去年暑假開始學習weka,是沖著weka部分買的,還不錯~挺實用的一本書,到現(xiàn)在還在有看??!
  •   好書,翻譯版的書很多地方看不懂,有英文版的就好了
  •   很好的一本書,不管入門和專家本書都有很大作用
  •   書不錯,價格也好,而且原版的竟然比翻譯的便宜,哈哈
  •   這是本經(jīng)典的DataMining書籍,值得一讀!
  •   首先,數(shù)的印制和紙質(zhì)不錯,影印版一樣很清晰;
    其次,內(nèi)容正在看,就目前所看來說,應(yīng)該是本不錯的書;
  •   首先是書,質(zhì)量不錯,印刷的也很精良。與我的要求相符。然后是送貨,比預(yù)想中的要快,并且不要運費,服務(wù)態(tài)度很好。
  •   送貨很快。正再看
  •   書上有講一款軟件,用于機器學習方面的。不過還沒試過。
  •   從事數(shù)據(jù)挖掘領(lǐng)域研究,買回來還沒怎么學習呢,不過是professor推薦的,應(yīng)該不錯
  •   可以從入門學習。例子很多,很容易把握概念。You can study from the very basic concept with this book as it uses a lot of examples to explain every algorithm and principle. But the only thing that I didn't ***e is the book cover is a little bit dirty.
  •   英文原版的不錯讀起來流暢不想一些翻譯的爛書不知所云
  •   上學的時候老師推薦的書。英文版的看起來有些吃力,但是比中文版要好一些??梢愿形陌鎸φ罩鴮W習
  •   課本不錯,很新,,,大家要記得要發(fā)票啊。
  •   嗯,看了一小部分了,很不錯,算是實用。
  •   還不錯的,我是和中文對照看的~
  •   剛看。沖著作者名氣買的,應(yīng)該還不錯。
  •   買了一周了,看來前4章,有點失望。語言對讀者的重要性不言而喻,尤其是對以英語為第二語言的讀者。我對這本書的語言寫作風格很是不爽。作者做為一個新西蘭人使用的書面英語非?;逎?,經(jīng)常使用一些非主流的單詞。先忍一忍,趕快把后面的weka工具包那部分看完。
  •   一般,印刷質(zhì)量不行
  •     這本書確實如所知道的那樣,翻譯得很水。很多一些概念的東西就像把你隔在某種屏障外,然后其實說的并不是那么枯燥的東西…………
      本書主要還是介紹機器學習的,用這本書的目的就是為了了解weka中算法實現(xiàn)的思想。從這點出發(fā)這本書還算是比較值當?shù)牧?,比官方的文檔確實還是要精細更好一些……
  •     作者可以說是享譽盛名,但是這本書寫出來,基本上章法全無。理論和例子基本上沒有幾個是適合入門者的,加上翻譯有些地方表意不清。初階入門者看了的話,肯定一團迷霧。
      評論太短了嘛?評論太短了嘛?評論太短了嘛?評論太短了嘛?評論太短了嘛?評論太短了嘛?評論太短了嘛?評論太短了嘛?
  •     -----------------------------------------
      
      外文教材, 外文參考書 請咨詢
      
      http://shop35575714.taobao.com
      
      
      ----------------------------------------
  •     我覺得,可以當作weka的使用手冊來看,但是比weka自帶的指南寫的好看。
      
      算法部分的介紹很詳細。
  •     這本書雖然標題是Data Mining,但是核心內(nèi)容還是機器學習。我理解“數(shù)據(jù)挖掘”主要指的還是KDD,即基于數(shù)據(jù)庫的知識發(fā)現(xiàn)。在這個領(lǐng)域,基本的方法是聚類和關(guān)聯(lián)規(guī)則發(fā)現(xiàn);而在機器學習領(lǐng)域,主要研究的是分類。
      
      這本書的內(nèi)容主要是分類,也有一部分聚類的內(nèi)容,關(guān)聯(lián)規(guī)則發(fā)現(xiàn)基本上沒有講。但它對分類講的很詳細,主要的思想都涉及到了,體系整理很好。它對相關(guān)的知識,如分類算法的性能估計,如何在分類中結(jié)合成本考慮等也做了詳細的介紹。因此,認真讀讀這本書對于學好用好分類是很有幫助的。
      
      它的第二部分介紹了Weka這個機器學習框架的使用。用好這個框架能夠幫助簡化機器學習算法研究中的一些輔助工作,作用還是很大的。
      
      因此,推薦對機器學習,特別是分類有興趣的同志們看看這本書。
  •     這本書我覺得最值得閱讀的地方還是后面WEKA的部分,當然了前面也有關(guān)于WEKA文件的表示說明。至于其他的方面么,這本書只能說是還湊合。當然了如果你已經(jīng)有了本書,又不想買其他的數(shù)據(jù)挖掘方面的教程,還是不錯的。呵呵
  •     這種書的翻譯都是一個導(dǎo)師,找多個研究生每人分倆章節(jié),對這金山詞霸翻譯的,能好到哪里。所以要讀還是讀原版。
  •       翻譯的不大好,譬如:指針與引用的"引用(reference)",被翻譯成"參考";JavaBean被翻譯為Java豆;異常的"拋出"被翻譯為"丟棄"....
        不過對于想學習Weka,研究Weka源碼的朋友來說,該書的算法介紹和軟件使用還是很不錯的.
  •     這本dm的書啃完了,覺得有點這個書有點“偏見”,怎么理解呢
      前面的東西不錯哦,可是后半部分的Weka平臺我個人覺得翻翻就行了,要學還不如看看spss的書呢,前面關(guān)于機器模型的建立的數(shù)學基礎(chǔ)要求的不是很高,所以很適合一般沒有學過隨機過程的人看看,要是數(shù)學很牛的人,可以看看這個《模式分類》,呵呵這本書也不錯,偶正在讀,不過這書很BT,我也是慢慢的啃,挺“費牙”的,呵呵。
  •   呵呵,你轉(zhuǎn)行了?
  •   我都轉(zhuǎn)了一年了。。。。
  •   剛剛買了本.十一假期看.
  •   這個翻譯太搞了……
  •   這本書是英文版,何來的翻譯哦
 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7