數(shù)據(jù)挖掘原理與算法

出版時(shí)間:2009-6  出版社:清華大學(xué)出版社  作者:毛國(guó)君,段立娟 編著  頁(yè)數(shù):78  字?jǐn)?shù):134000  

前言

  《數(shù)據(jù)挖掘原理與算法》一書(shū)出版以來(lái),被許多高校作為本科生或者研究生的教材使用。幾年來(lái)許多教師給出了很好的建議,因此我們?cè)?007年針對(duì)相關(guān)問(wèn)題進(jìn)行了修訂并出版了其第二版。該教材是一本全面介紹數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)技術(shù)的專(zhuān)業(yè)書(shū)籍,具有內(nèi)容系統(tǒng)、知識(shí)含量高等特點(diǎn)。可能也正是因?yàn)檫@些特點(diǎn),作為教材給教師帶來(lái)了一些授課難點(diǎn)。特別是,由于教材使用的對(duì)象不同,對(duì)教材內(nèi)容進(jìn)行選擇是必需的。為了讓教師更好地使用《數(shù)據(jù)挖掘原理與算法》一書(shū),減輕教師的負(fù)擔(dān),我們編寫(xiě)了本教師用書(shū)?!  稊?shù)據(jù)挖掘原理與算法(第二版)教師用書(shū)》主要從四個(gè)部分為教師提供了參考:一、對(duì)教材每章的部分習(xí)題給出了參考答案;二、介紹各章授課內(nèi)容重點(diǎn)與課時(shí)分配;三、針對(duì)不同的授課學(xué)生對(duì)象給出了課時(shí)安排的建議;四、提供了兩套樣本試卷及其參考答案?! ∧康氖菫榱藥椭處熖岣咧v課的效率,但不能代替教師的教學(xué)研究工作。特別考慮到教師用書(shū)也可能被學(xué)生使用,故對(duì)教材后面的習(xí)題并沒(méi)有給出全部解答?! ≌w上說(shuō),數(shù)據(jù)挖掘技術(shù)包含概念與過(guò)程、原理與方法兩個(gè)主要部分。對(duì)于有關(guān)概念與過(guò)程,主要集中在《數(shù)據(jù)挖掘原理與算法》(第二版)第l章和第2章,不論學(xué)生對(duì)象如何,教師都應(yīng)該給予重視,力求全面而直觀地進(jìn)行介紹。數(shù)據(jù)挖掘中的原理與方法,分布在《數(shù)據(jù)挖掘原理與算法》(第二版)的第3—8章,涵蓋關(guān)聯(lián)規(guī)則、分類(lèi)、聚類(lèi)、序列、空間以及Web挖掘等分支。我們認(rèn)為,關(guān)聯(lián)規(guī)則、分類(lèi)、聚類(lèi)是經(jīng)典內(nèi)容,不論學(xué)生對(duì)象如何,教師都應(yīng)該選擇一些典型的理論和算法進(jìn)行剖析。對(duì)于不同的教學(xué)對(duì)象,教師可以對(duì)第3—5章的內(nèi)容進(jìn)行合理選擇。例如,如果準(zhǔn)備給本科生開(kāi)一個(gè)只有32課時(shí)的課.程,那么最起碼的要求是在對(duì)于關(guān)聯(lián)規(guī)則、分類(lèi)、聚類(lèi)等基本概念和原理講述清楚的前提下,能把Apriori、ID3和k-means算法剖析清楚即可。第6—8章的內(nèi)容相對(duì)比較松散,對(duì)于研究生來(lái)說(shuō),我們認(rèn)為需要進(jìn)行選擇性地介紹或討論。這是因?yàn)檫@些內(nèi)容屬于數(shù)據(jù)挖掘的較前沿的課題,而且有著很廣泛的研究和應(yīng)用價(jià)值,因此對(duì)于研究生將來(lái)的研究工作可能會(huì)有很大的幫助。

內(nèi)容概要

《數(shù)據(jù)挖掘原理與算法》一書(shū)出版以來(lái),被許多高校作為本科生或者研究生教材使用,是一本全面介紹數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)技術(shù)的專(zhuān)業(yè)書(shū)籍,具有內(nèi)容系統(tǒng)、知識(shí)含量高等特點(diǎn)。為了讓教師更好地使用教材《數(shù)據(jù)挖掘原理與算法》(第二版),作者又編寫(xiě)了本書(shū)。本書(shū)分四個(gè)部分:一、對(duì)教材每章的部分習(xí)題給出了參考答案; 二、介紹各章授課內(nèi)容重點(diǎn)與課時(shí)分配; 三、針對(duì)不同的授課學(xué)生對(duì)象給出了課時(shí)安排的建議; 四、提供了兩套樣本試卷及其參考答案。    本書(shū)供使用《數(shù)據(jù)挖掘原理與算法》一書(shū)的教師作參考。

書(shū)籍目錄

第一部分 各章習(xí)題及部分 參考答案 第1章 緒論 第2章 知識(shí)發(fā)現(xiàn)過(guò)程與應(yīng)用結(jié)構(gòu) 第3章 關(guān)聯(lián)規(guī)則挖掘理論和算法 第4章 分類(lèi)方法 第5章 聚類(lèi)方法 第6章 時(shí)間序列和序列模式挖掘 第7章 Web挖掘技術(shù) 第8章 空間挖掘第二部分 各章 授課重點(diǎn)與課時(shí)分配 第1章 緒論 第2章 知識(shí)發(fā)現(xiàn)過(guò)程與應(yīng)用結(jié)構(gòu) 第3章 關(guān)聯(lián)規(guī)則挖掘理論和算法 第4章 分類(lèi)方法 第5章 聚類(lèi)方法 第6章 時(shí)間序列和序列模式挖掘 第7章 Web挖掘技術(shù) 第8章 空間挖掘第三部分 按總學(xué)時(shí)規(guī)劃的教學(xué)大綱 48學(xué)時(shí)的教學(xué)大綱(本科生) 32學(xué)時(shí)的教學(xué)大綱(本科生) 48學(xué)時(shí)的教學(xué)大綱(研究生)第四部分 樣本試卷 樣本試卷1(本科生) 樣本試卷2(研究生) 樣本試卷1(本科生)的參考答案 樣本試卷2(研究生)的參考答案

章節(jié)摘錄

  在關(guān)系型數(shù)據(jù)庫(kù)的研究和產(chǎn)品提升過(guò)程中,人們一直在探索組織大型數(shù)據(jù)和快速訪問(wèn)的相關(guān)技術(shù)。高性能關(guān)系數(shù)據(jù)庫(kù)引擎以及相關(guān)的分布式查詢(xún)、并發(fā)控制等技術(shù)的使用,已經(jīng)提升了數(shù)據(jù)庫(kù)的應(yīng)用能力。在數(shù)據(jù)的快速訪問(wèn)、集成與抽取等問(wèn)題的解決上積累了經(jīng)驗(yàn)。數(shù)據(jù)倉(cāng)庫(kù)作為一種新型的數(shù)據(jù)存儲(chǔ)和處理手段,被數(shù)據(jù)庫(kù)廠商普遍接受并且相關(guān)輔助建模和管理工具快速推向市場(chǎng),成為多數(shù)據(jù)源集成的一種有效的技術(shù)支撐環(huán)境。因此,人們已經(jīng)具備利用多種方式存儲(chǔ)海量數(shù)據(jù)的能力。這些豐富多彩的數(shù)據(jù)存儲(chǔ)、管理以及訪問(wèn)技術(shù)的發(fā)展,為數(shù)據(jù)挖掘技術(shù)的研究和應(yīng)用提供了豐富的土壤?! ∮?jì)算機(jī)芯片技術(shù)的發(fā)展,使計(jì)算機(jī)的處理和存儲(chǔ)能力日益提高。隨之而來(lái)的是硬盤(pán)、CPU等關(guān)鍵部件的價(jià)格大幅度下降,使得人們收集、存儲(chǔ)和處理數(shù)據(jù)的能力和欲望不斷提高。經(jīng)過(guò)幾十年的發(fā)展,計(jì)算機(jī)的體系結(jié)構(gòu),特別是并行處理技術(shù)已經(jīng)逐漸成熟和普遍應(yīng)用,并成為支持大型數(shù)據(jù)處理應(yīng)用的基礎(chǔ)。計(jì)算機(jī)性能的提高和先進(jìn)的體系結(jié)構(gòu)的發(fā)展使數(shù)據(jù)挖掘技術(shù)的研究和應(yīng)用成為可能。  歷經(jīng)了十幾年的發(fā)展,包括基于統(tǒng)計(jì)學(xué)、人工智能等在內(nèi)的理論與技術(shù)性成果已經(jīng)被成功地應(yīng)用到商業(yè)處理和分析中。這些應(yīng)用從某種程度上為數(shù)據(jù)挖掘技術(shù)的提出和發(fā)展起到了極大地推動(dòng)作用。數(shù)據(jù)挖掘系統(tǒng)的核心模塊技術(shù)和算法都離不開(kāi)這些理論和技術(shù)的支持。從某種意義上講,這些理論本身的發(fā)展和應(yīng)用為數(shù)據(jù)挖掘提供了有價(jià)值的理論和應(yīng)用積累?! ?.數(shù)據(jù)挖掘技術(shù)是一個(gè)交叉研究分支,簡(jiǎn)述影響它產(chǎn)生和發(fā)展的主要研究學(xué)科或分支及其關(guān)系。參考答案:略。  7.數(shù)據(jù)(Data)、信息(Information)和知識(shí)(Knowledge)是人們認(rèn)識(shí)和利用數(shù)據(jù)的三個(gè)不同階段,數(shù)據(jù)挖掘技術(shù)是如何把它們有機(jī)的結(jié)合在一起的?  參考答案:從數(shù)據(jù)、信息和知識(shí)三個(gè)層面上看,數(shù)據(jù)是最原始的未經(jīng)組織和處理的信息源。信息或稱(chēng)有效信息是指對(duì)人們?cè)谀承┓矫嬗袃r(jià)值的東西。知識(shí)是二種現(xiàn)實(shí)世界信息的抽象和濃縮,是一種概念、規(guī)則、模式和規(guī)律等。數(shù)據(jù)挖掘技術(shù)通過(guò)對(duì)原始數(shù)據(jù)進(jìn)行微觀、中觀乃至宏觀的統(tǒng)計(jì)、分析、綜合和推理,發(fā)現(xiàn)數(shù)據(jù)間的關(guān)聯(lián)性、未來(lái)趨勢(shì)以及一般性的概括知識(shí)等,轉(zhuǎn)變成可以用來(lái)指導(dǎo)人們某些高級(jí)商務(wù)活動(dòng)的有用信息?! ?.從數(shù)據(jù)挖掘研究角度看,如何理解數(shù)據(jù)、信息和知識(shí)的不同和聯(lián)系。  參考答案:略?! ?.簡(jiǎn)述數(shù)據(jù)挖掘技術(shù)將來(lái)的發(fā)展趨勢(shì)?! ⒖即鸢福簩?duì)于數(shù)據(jù)挖掘技術(shù)的發(fā)展趨勢(shì),應(yīng)該分兩方面辯證的理解。 ?。?)數(shù)據(jù)挖掘技術(shù)已經(jīng)存在相當(dāng)大市場(chǎng),將成為對(duì)工業(yè)產(chǎn)生重要影響的關(guān)鍵技術(shù)之一。同時(shí),并行計(jì)算機(jī)體系結(jié)構(gòu)研究和KDD也被列入今后5年內(nèi)公司應(yīng)該投資的10個(gè)新技術(shù)領(lǐng)域之一。這些資料都表明,數(shù)據(jù)挖掘技術(shù)在將來(lái)有很大的發(fā)展?jié)摿翱臻g。

編輯推薦

  本書(shū)供使用《數(shù)據(jù)挖掘原理與算法》一書(shū)的教師作參考。

圖書(shū)封面

評(píng)論、評(píng)分、閱讀與下載


    數(shù)據(jù)挖掘原理與算法 PDF格式下載


用戶(hù)評(píng)論 (總計(jì)0條)

 
 

 

250萬(wàn)本中文圖書(shū)簡(jiǎn)介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書(shū)網(wǎng) 手機(jī)版

京ICP備13047387號(hào)-7