出版時間:2009-6 出版社:清華大學(xué)出版社 作者:毛國君,段立娟 編著 頁數(shù):78 字數(shù):134000
前言
《數(shù)據(jù)挖掘原理與算法》一書出版以來,被許多高校作為本科生或者研究生的教材使用。幾年來許多教師給出了很好的建議,因此我們在2007年針對相關(guān)問題進行了修訂并出版了其第二版。該教材是一本全面介紹數(shù)據(jù)挖掘和知識發(fā)現(xiàn)技術(shù)的專業(yè)書籍,具有內(nèi)容系統(tǒng)、知識含量高等特點。可能也正是因為這些特點,作為教材給教師帶來了一些授課難點。特別是,由于教材使用的對象不同,對教材內(nèi)容進行選擇是必需的。為了讓教師更好地使用《數(shù)據(jù)挖掘原理與算法》一書,減輕教師的負擔,我們編寫了本教師用書?! 稊?shù)據(jù)挖掘原理與算法(第二版)教師用書》主要從四個部分為教師提供了參考:一、對教材每章的部分習(xí)題給出了參考答案;二、介紹各章授課內(nèi)容重點與課時分配;三、針對不同的授課學(xué)生對象給出了課時安排的建議;四、提供了兩套樣本試卷及其參考答案?! ∧康氖菫榱藥椭處熖岣咧v課的效率,但不能代替教師的教學(xué)研究工作。特別考慮到教師用書也可能被學(xué)生使用,故對教材后面的習(xí)題并沒有給出全部解答。 整體上說,數(shù)據(jù)挖掘技術(shù)包含概念與過程、原理與方法兩個主要部分。對于有關(guān)概念與過程,主要集中在《數(shù)據(jù)挖掘原理與算法》(第二版)第l章和第2章,不論學(xué)生對象如何,教師都應(yīng)該給予重視,力求全面而直觀地進行介紹。數(shù)據(jù)挖掘中的原理與方法,分布在《數(shù)據(jù)挖掘原理與算法》(第二版)的第3—8章,涵蓋關(guān)聯(lián)規(guī)則、分類、聚類、序列、空間以及Web挖掘等分支。我們認為,關(guān)聯(lián)規(guī)則、分類、聚類是經(jīng)典內(nèi)容,不論學(xué)生對象如何,教師都應(yīng)該選擇一些典型的理論和算法進行剖析。對于不同的教學(xué)對象,教師可以對第3—5章的內(nèi)容進行合理選擇。例如,如果準備給本科生開一個只有32課時的課.程,那么最起碼的要求是在對于關(guān)聯(lián)規(guī)則、分類、聚類等基本概念和原理講述清楚的前提下,能把Apriori、ID3和k-means算法剖析清楚即可。第6—8章的內(nèi)容相對比較松散,對于研究生來說,我們認為需要進行選擇性地介紹或討論。這是因為這些內(nèi)容屬于數(shù)據(jù)挖掘的較前沿的課題,而且有著很廣泛的研究和應(yīng)用價值,因此對于研究生將來的研究工作可能會有很大的幫助。
內(nèi)容概要
《數(shù)據(jù)挖掘原理與算法》一書出版以來,被許多高校作為本科生或者研究生教材使用,是一本全面介紹數(shù)據(jù)挖掘和知識發(fā)現(xiàn)技術(shù)的專業(yè)書籍,具有內(nèi)容系統(tǒng)、知識含量高等特點。為了讓教師更好地使用教材《數(shù)據(jù)挖掘原理與算法》(第二版),作者又編寫了本書。本書分四個部分:一、對教材每章的部分習(xí)題給出了參考答案; 二、介紹各章授課內(nèi)容重點與課時分配; 三、針對不同的授課學(xué)生對象給出了課時安排的建議; 四、提供了兩套樣本試卷及其參考答案。 本書供使用《數(shù)據(jù)挖掘原理與算法》一書的教師作參考。
書籍目錄
第一部分 各章習(xí)題及部分 參考答案 第1章 緒論 第2章 知識發(fā)現(xiàn)過程與應(yīng)用結(jié)構(gòu) 第3章 關(guān)聯(lián)規(guī)則挖掘理論和算法 第4章 分類方法 第5章 聚類方法 第6章 時間序列和序列模式挖掘 第7章 Web挖掘技術(shù) 第8章 空間挖掘第二部分 各章 授課重點與課時分配 第1章 緒論 第2章 知識發(fā)現(xiàn)過程與應(yīng)用結(jié)構(gòu) 第3章 關(guān)聯(lián)規(guī)則挖掘理論和算法 第4章 分類方法 第5章 聚類方法 第6章 時間序列和序列模式挖掘 第7章 Web挖掘技術(shù) 第8章 空間挖掘第三部分 按總學(xué)時規(guī)劃的教學(xué)大綱 48學(xué)時的教學(xué)大綱(本科生) 32學(xué)時的教學(xué)大綱(本科生) 48學(xué)時的教學(xué)大綱(研究生)第四部分 樣本試卷 樣本試卷1(本科生) 樣本試卷2(研究生) 樣本試卷1(本科生)的參考答案 樣本試卷2(研究生)的參考答案
章節(jié)摘錄
在關(guān)系型數(shù)據(jù)庫的研究和產(chǎn)品提升過程中,人們一直在探索組織大型數(shù)據(jù)和快速訪問的相關(guān)技術(shù)。高性能關(guān)系數(shù)據(jù)庫引擎以及相關(guān)的分布式查詢、并發(fā)控制等技術(shù)的使用,已經(jīng)提升了數(shù)據(jù)庫的應(yīng)用能力。在數(shù)據(jù)的快速訪問、集成與抽取等問題的解決上積累了經(jīng)驗。數(shù)據(jù)倉庫作為一種新型的數(shù)據(jù)存儲和處理手段,被數(shù)據(jù)庫廠商普遍接受并且相關(guān)輔助建模和管理工具快速推向市場,成為多數(shù)據(jù)源集成的一種有效的技術(shù)支撐環(huán)境。因此,人們已經(jīng)具備利用多種方式存儲海量數(shù)據(jù)的能力。這些豐富多彩的數(shù)據(jù)存儲、管理以及訪問技術(shù)的發(fā)展,為數(shù)據(jù)挖掘技術(shù)的研究和應(yīng)用提供了豐富的土壤?! ∮嬎銠C芯片技術(shù)的發(fā)展,使計算機的處理和存儲能力日益提高。隨之而來的是硬盤、CPU等關(guān)鍵部件的價格大幅度下降,使得人們收集、存儲和處理數(shù)據(jù)的能力和欲望不斷提高。經(jīng)過幾十年的發(fā)展,計算機的體系結(jié)構(gòu),特別是并行處理技術(shù)已經(jīng)逐漸成熟和普遍應(yīng)用,并成為支持大型數(shù)據(jù)處理應(yīng)用的基礎(chǔ)。計算機性能的提高和先進的體系結(jié)構(gòu)的發(fā)展使數(shù)據(jù)挖掘技術(shù)的研究和應(yīng)用成為可能?! v經(jīng)了十幾年的發(fā)展,包括基于統(tǒng)計學(xué)、人工智能等在內(nèi)的理論與技術(shù)性成果已經(jīng)被成功地應(yīng)用到商業(yè)處理和分析中。這些應(yīng)用從某種程度上為數(shù)據(jù)挖掘技術(shù)的提出和發(fā)展起到了極大地推動作用。數(shù)據(jù)挖掘系統(tǒng)的核心模塊技術(shù)和算法都離不開這些理論和技術(shù)的支持。從某種意義上講,這些理論本身的發(fā)展和應(yīng)用為數(shù)據(jù)挖掘提供了有價值的理論和應(yīng)用積累?! ?.數(shù)據(jù)挖掘技術(shù)是一個交叉研究分支,簡述影響它產(chǎn)生和發(fā)展的主要研究學(xué)科或分支及其關(guān)系。參考答案:略。 7.數(shù)據(jù)(Data)、信息(Information)和知識(Knowledge)是人們認識和利用數(shù)據(jù)的三個不同階段,數(shù)據(jù)挖掘技術(shù)是如何把它們有機的結(jié)合在一起的? 參考答案:從數(shù)據(jù)、信息和知識三個層面上看,數(shù)據(jù)是最原始的未經(jīng)組織和處理的信息源。信息或稱有效信息是指對人們在某些方面有價值的東西。知識是二種現(xiàn)實世界信息的抽象和濃縮,是一種概念、規(guī)則、模式和規(guī)律等。數(shù)據(jù)挖掘技術(shù)通過對原始數(shù)據(jù)進行微觀、中觀乃至宏觀的統(tǒng)計、分析、綜合和推理,發(fā)現(xiàn)數(shù)據(jù)間的關(guān)聯(lián)性、未來趨勢以及一般性的概括知識等,轉(zhuǎn)變成可以用來指導(dǎo)人們某些高級商務(wù)活動的有用信息。 8.從數(shù)據(jù)挖掘研究角度看,如何理解數(shù)據(jù)、信息和知識的不同和聯(lián)系。 參考答案:略?! ?.簡述數(shù)據(jù)挖掘技術(shù)將來的發(fā)展趨勢?! ⒖即鸢福簩τ跀?shù)據(jù)挖掘技術(shù)的發(fā)展趨勢,應(yīng)該分兩方面辯證的理解?! 。?)數(shù)據(jù)挖掘技術(shù)已經(jīng)存在相當大市場,將成為對工業(yè)產(chǎn)生重要影響的關(guān)鍵技術(shù)之一。同時,并行計算機體系結(jié)構(gòu)研究和KDD也被列入今后5年內(nèi)公司應(yīng)該投資的10個新技術(shù)領(lǐng)域之一。這些資料都表明,數(shù)據(jù)挖掘技術(shù)在將來有很大的發(fā)展?jié)摿翱臻g。
編輯推薦
本書供使用《數(shù)據(jù)挖掘原理與算法》一書的教師作參考。
圖書封面
評論、評分、閱讀與下載