數(shù)據(jù)倉庫與數(shù)據(jù)挖掘

出版時間:2009-5  出版社:清華大學出版社  作者:陳志泊  頁數(shù):249  
Tag標簽:無  

前言

隨著計算機和信息時代的迅猛發(fā)展,人類收集、存儲和訪問數(shù)據(jù)的能力大大增強,快速增長的海量數(shù)據(jù)集已經(jīng)遠遠超出了人類的理解能力,傳統(tǒng)的數(shù)據(jù)分析工具也顯得力不從心。如何不被這些海量數(shù)據(jù)淹沒,而是有效地組織這些數(shù)據(jù),并且從中找出有價值的知識,從而幫助人類制定正確的決策?針對這一問題,數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術應運而生,并且顯示出強大的生命力。要將海量數(shù)據(jù)轉換成為有用的信息和知識,首先要有效地收集和組織數(shù)據(jù)。數(shù)據(jù)倉庫是良好的數(shù)據(jù)收集和組織工具,它的任務是搜集來自各個業(yè)務系統(tǒng)的有用數(shù)據(jù),存放在一個集成的儲存區(qū)內(nèi)。在數(shù)據(jù)倉庫的豐富完整的數(shù)據(jù)基礎上,數(shù)據(jù)挖掘技術可以從中挖掘出有價值的知識,從而幫助決策者做出正確決策。本書主要介紹數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術的基本原理和應用方法,全書共分為12章,主要內(nèi)容包括數(shù)據(jù)倉庫的概念和體系結構、數(shù)據(jù)倉庫的數(shù)據(jù)存儲和處理、數(shù)據(jù)倉庫系統(tǒng)的設計與開發(fā)、關聯(lián)規(guī)則、數(shù)據(jù)分類、數(shù)據(jù)聚類、貝葉斯網(wǎng)絡、粗糙集、神經(jīng)網(wǎng)絡、遺傳算法、統(tǒng)計分析、文本和Web挖掘。其中,前3章主要介紹數(shù)據(jù)倉庫的基本原理和數(shù)據(jù)倉庫系統(tǒng)的組建方法,后面的章節(jié)介紹當前流行的數(shù)據(jù)挖掘算法的主要思想和理論基礎,并且給出豐富的應用實例。本書緊跟數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術的發(fā)展和人才培養(yǎng)的目標,有以下幾個特點: (1) 可讀性強,文字敘述深入淺出,易讀易用,即使是初學者,閱讀起來也比較容易。(2) 概念清晰,條理清楚,內(nèi)容取舍合理。(3) 本書強調基礎,重視實例。各章節(jié)都以經(jīng)典算法為主,介紹其主要思想和基本原理,并且給出恰當和豐富的實例。(4) 書中實例和課后習題實用、豐富,通過練習,讀者可以對各個知識點從不同角度得到訓練,鞏固和掌握所學知識。(5) 教學資源豐富,本書提供多媒體教學課件和習題參考答案,方便教學。對于上述資源,讀者可到清華大學出版社的網(wǎng)站http://www.tup.com.cn/下載。(6) 對于數(shù)據(jù)倉庫的組建方法和多數(shù)章節(jié)中的數(shù)據(jù)挖掘算法,本書都使用Microsoft SQL Server 2005進行了操作實現(xiàn),這種做法與市場主流開發(fā)工具和技術同步,有利于讀者走向社會。本書各章節(jié)之間銜接自然,同時各章節(jié)又有一定的獨立性,讀者可按教材的自然順序學習,也可以根據(jù)實際情況挑選需要的章節(jié)學習。本書可以作為高等學校計算機及相關專業(yè)本科、研究生學習數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的教材,也可供相關領域的廣大科技工作人員和高校師生參考。本書由陳志泊擔任主編,第1~第3章由聶耿青編寫,第5、第6和第11章由韓慧編寫,第4和第10章由孫俏編寫,第7~第9和第12章由王建新編寫。由于時間倉促,加之編者水平有限,書中不足之處敬請批評指正。

內(nèi)容概要

本書主要介紹數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術的基本原理和應用方法,全書共分為12章,主要內(nèi)容包括數(shù)據(jù)倉庫的概念和體系結構、數(shù)據(jù)倉庫的數(shù)據(jù)存儲和處理、數(shù)據(jù)倉庫系統(tǒng)的設計與開發(fā)、關聯(lián)規(guī)則、數(shù)據(jù)分類、數(shù)據(jù)聚類、貝葉斯網(wǎng)絡、粗糙集、神經(jīng)網(wǎng)絡、遺傳算法、統(tǒng)計分析、文本和Web挖掘。    本書既重視理論知識的講解,又強調應用技能的培養(yǎng)。每章首先介紹算法的主要思想和理論基礎,之后利用算法去解決實例中給出的任務,而且對于數(shù)據(jù)倉庫的組建方法和多數(shù)章節(jié)中的數(shù)據(jù)挖掘算法,本書都使用Microsoft SQL Server 2005進行了操作實現(xiàn)。本書通過對具體實例的學習和實踐,使讀者掌握數(shù)據(jù)倉庫和數(shù)據(jù)挖掘中必要的知識點,達到學以致用的目的。    本書每章均配有習題,習題形式為選擇題、簡答題和操作題,可以幫助讀者進一步鞏固和掌握所學知識。此外,本書提供多媒體教學課件和習題參考答案,讀者可到清華大學出版社網(wǎng)站(http://www.tup.com.cn/)下載。    本書可以作為高等學校計算機及相關專業(yè)本科、研究生的數(shù)據(jù)倉庫和數(shù)據(jù)挖掘教材,也可供相關領域的廣大科技工作人員和高校師生參考。

書籍目錄

第1章 數(shù)據(jù)倉庫的概念與體系結構  1.1 數(shù)據(jù)倉庫的概念、特點與組成  1.2 數(shù)據(jù)挖掘的概念與方法  1.3 數(shù)據(jù)倉庫的技術、方法與產(chǎn)品  1.4 數(shù)據(jù)倉庫系統(tǒng)的體系結構  1.5 數(shù)據(jù)倉庫的產(chǎn)生、發(fā)展與未來  1.6 小結  1.7 習題第2章 數(shù)據(jù)倉庫的數(shù)據(jù)存儲與處理  2.1 數(shù)據(jù)倉庫的數(shù)據(jù)結構  2.2 數(shù)據(jù)倉庫的數(shù)據(jù)特征  2.3 數(shù)據(jù)倉庫的數(shù)據(jù)ETL過程  2.4 多維數(shù)據(jù)模型  2.5 小結  2.6 習題第3章 數(shù)據(jù)倉庫系統(tǒng)的設計與開發(fā)  3.1 數(shù)據(jù)倉庫系統(tǒng)的設計與開發(fā)概述  3.2 基于SQL Server 2005的數(shù)據(jù)倉庫數(shù)據(jù)庫設計  3.3 使用SQL Server 2005建立多維數(shù)據(jù)模型  3.4 小結  3.5 習題第4章 關聯(lián)規(guī)則  4.1 概述  4.2 引例  4.3 經(jīng)典算法  4.4 相關研究與應用  4.5 小結  4.6 習題第5章 數(shù)據(jù)分類  5.1 引例  5.2 分類問題概述  5.3 決策樹  5.4 支持向量機  5.5 近鄰分類方法  5.6 小結  5.7 習題第6章 數(shù)據(jù)聚類  6.1 引例  6.2 聚類分析概述  6.3 聚類分析中相似度的計算方法  6.4 kmeans聚類算法  6.5 層次聚類方法  6.6 小結  6.7 習題第7章 貝葉斯網(wǎng)絡第8章 粗糙集第9章 神經(jīng)網(wǎng)絡第10章 遺傳算法第11章 統(tǒng)計分析第12章 文本和Web挖掘參考文獻

章節(jié)摘錄

插圖:(3)分區(qū)維。分區(qū)維以同一結構生成兩個或多個維時,這些維結構相同,只是數(shù)值不同。例如,對于時間維,每一年都有相同的季度:相同的月和相同的天(除了閏年以外)。假定把度量事實表分割為2007年的數(shù)據(jù)和2008年的數(shù)據(jù),那么在OLAP分析中將頻繁使用時間分區(qū)維來分割數(shù)據(jù)倉庫中的數(shù)據(jù)。其中一個時間維是針對2007年的數(shù)據(jù),而另一個時間維針對2008年的數(shù)據(jù)。(4)分類維。分類維是通過對一個維的屬性值分組而創(chuàng)建的。例如,客戶表中有家庭收入屬性,如果希望查看客戶根據(jù)收入的購物方式,就可以生成一個含有家庭收入的分類維。(5)退化維。當維表中的主鍵在事實表中沒有與外鍵關聯(lián)時,這樣的維稱為退化維。退化維與事實表并無關系,但有時在查詢限制條件(如訂單號碼、出貨單編號等)中需要用到退化維。以銷售分析為例,通常是把出貨日期作為事實時間,而把訂單日期或需求日期等作為查詢條件,這里,訂單日期或需求日期就是退化維。(6)一致維。當有好幾個數(shù)據(jù)集市要合并成一個企業(yè)級數(shù)據(jù)倉庫時,可以使用一致維來集成數(shù)據(jù)集市,以便確保數(shù)據(jù)倉庫可以使用每個數(shù)據(jù)集市的事實。

編輯推薦

《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘》為普通高等教育“十一五”國家級規(guī)劃教材之一。

圖書封面

圖書標簽Tags

評論、評分、閱讀與下載


    數(shù)據(jù)倉庫與數(shù)據(jù)挖掘 PDF格式下載


用戶評論 (總計22條)

 
 

  •   非常好的書,有助于了解數(shù)據(jù)挖掘級大數(shù)據(jù)時代
  •   不錯,這個書很好,使我們老師要求的教材
  •   還不錯,是不本比較全面的好 教材
  •   內(nèi)容很詳細,是一本 好書
  •   老師指定教科書,想必不錯
  •   實驗步驟很全 方便 易懂
  •   質量很好、喜歡
  •   還行的,通俗易懂,可以作為入門教材,如果想深入研究數(shù)據(jù)挖掘這本書肯定是不夠的,總體來說作為教材尤其是本科高年級教材還是不錯的,沒廢話,合格。
  •   這本書很實用,也很新,作為教材,對學生的啟發(fā)很大。
  •   這本書是幫同學買的,還不錯吧
  •   有點知識點寫的不是很清楚
  •   需要深入研究
  •   難度適中,入門還是不錯的,例子很好
  •   商品還不錯!速度也夠快的!
  •   數(shù)據(jù)倉庫與數(shù)據(jù)挖掘 數(shù)據(jù)挖掘部分間的了些呢
  •   內(nèi)容全面,但過于寬泛,不能更深入的講講原理,是很適合自學。
  •   這本有點爛
  •   最近買了不少書,還沒空看呢!
  •   挺好的 評論的晚了 不好意思
  •   對新手來說,可以了。
  •   質量不錯。內(nèi)容不是很好?。?/li>
  •   書不錯,我用了,但不好掌握重點。
 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7