出版時間:2012-8 出版社:經(jīng)濟科學出版社 作者:李於洪 編 頁數(shù):264 字數(shù):310000
內(nèi)容概要
李於洪主編的《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘?qū)д摗窞閿?shù)據(jù)倉庫與數(shù)據(jù)挖掘的基礎教程,是作者多年來從事數(shù)據(jù)倉庫與數(shù)據(jù)挖掘課程教學經(jīng)驗的梳理和總結(jié)。為了增強內(nèi)容的直觀性和可理解度,全書以大量圖、表、實例融入其中。全書共分為四篇14章。第一篇為導引,共分2章:用實例和實例分析引導學生理解數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的概念內(nèi)涵及其產(chǎn)生背景。第二篇為數(shù)據(jù)倉庫,共分5章:詳細介紹了數(shù)據(jù)倉庫的體系結(jié)構(gòu)及其組成部分的功能;從商業(yè)需求的角度介紹了數(shù)據(jù)倉庫維度建模方法和聯(lián)機分析處理操作;介紹了元數(shù)據(jù)在數(shù)據(jù)倉庫建設中的重要性、分類方法與作用。第三篇為數(shù)據(jù)挖掘,共分4章:通過淺顯易懂的語言及實例,深入淺出地介紹了關(guān)聯(lián)分析方法、神經(jīng)網(wǎng)絡算法、決策樹算法和聚類分析方法。第四篇為實驗與工具,共分3章:提供了數(shù)據(jù)倉庫實驗、神經(jīng)網(wǎng)絡建模實驗、決策樹與關(guān)聯(lián)分析實驗,強化培養(yǎng)學生的應用能力。
《數(shù)據(jù)倉庫與數(shù)據(jù)挖掘?qū)д摗房勺鳛槠胀ǜ叩仍盒S嬎銠C專業(yè)、軟件工程專業(yè)、信管專業(yè)等其他相關(guān)專業(yè)的教材,也可作為數(shù)據(jù)倉庫與數(shù)據(jù)挖掘方面的培訓教材,對于希望了解或?qū)W習數(shù)據(jù)倉庫與數(shù)據(jù)挖掘知識的自學人士,本書具有較強的可讀性。
書籍目錄
第一篇 導引
第1章 數(shù)據(jù)倉庫概念與內(nèi)涵
1.1 數(shù)據(jù)倉庫概念
1.1.1 數(shù)據(jù)倉庫的產(chǎn)生
1.1.2 數(shù)據(jù)倉庫應用實例:理解數(shù)據(jù)倉庫的應用目標與作用
1.2 數(shù)據(jù)倉庫的四個基本特征
1.2.1 數(shù)據(jù)倉庫的數(shù)據(jù)是面向主題的
1.2.2 數(shù)據(jù)倉庫的數(shù)據(jù)是集成的
1.2.3 數(shù)據(jù)倉庫的數(shù)據(jù)是不可更新的
1.2.4 數(shù)據(jù)倉庫的數(shù)據(jù)是隨時間不斷變化的
1.3 數(shù)據(jù)集市——部門級數(shù)據(jù)倉庫
1.3.1 自上而下構(gòu)建數(shù)據(jù)集市
1.3.2 自下而上構(gòu)建數(shù)據(jù)集市
1.3.3 自上而下與自下而上結(jié)合構(gòu)建數(shù)據(jù)集市
習題
討論題
第2章 數(shù)據(jù)挖掘概念與內(nèi)涵
2.1 數(shù)據(jù)挖掘概念
2.1.1 數(shù)據(jù)挖掘的產(chǎn)生
2.1.2 數(shù)據(jù)挖掘應用實例:理解數(shù)據(jù)挖掘的應用目標與作用
2.1.3 數(shù)據(jù)挖掘的定義
2.2 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘的關(guān)系
討論題
第二篇 數(shù)據(jù)倉庫
第3章 數(shù)據(jù)倉庫的體系結(jié)構(gòu)及其組成部分
3.1 數(shù)據(jù)倉庫的體系結(jié)構(gòu)
3.2 數(shù)據(jù)倉庫的組成部分及其功能
3.2.1 源數(shù)據(jù)部分
3.2.2 數(shù)據(jù)準備部分
3.2.3 數(shù)據(jù)存儲部分
3.2.4 信息傳遞部分
思考題
習題
討論題
第4章 數(shù)據(jù)倉庫數(shù)據(jù)的商業(yè)需求分析
4.1 收集商業(yè)需求數(shù)據(jù)碰到的問題
4.2 商業(yè)數(shù)據(jù)維度化分析
4.3 商業(yè)維度實例分析
思考題
習題
第5章 數(shù)據(jù)倉庫的維度建模
5.1 維度建?;A
5.2 星型模式及其查詢的鉆取
5.2.1 星型模式維度表內(nèi)容的特征
5.2.2 星型模式事實表內(nèi)容的特征
5.2.3 星型模式的優(yōu)勢
5.3 雪花型模式:對維度表的再處理
5.4 聚集事實表:對關(guān)鍵指標的再處理
5.4.1 理解事實表的數(shù)據(jù)量
5.4.2 理解聚集事實表的作用
5.4.3 對事實表進行聚集的三種方法
5.4.4 聚集過程中相關(guān)問題討論
思考題
習題
第6章 數(shù)據(jù)倉庫中的聯(lián)機分析處理——OLAP
6.1 OLAP的含義、規(guī)則與特征
6.1.1 OLAP的含義
6.1.2 OLAP的規(guī)則
6.1.3 OLAP的特征
6.2 OLAP的基本操作
6.2.1 切片
6.2.2 切塊
6.2.3 上鉆與下鉆
6.2.4 旋轉(zhuǎn)
6.3 OLAP模型結(jié)構(gòu)
6.3.1 關(guān)系聯(lián)機分析處理(ROLAP)結(jié)構(gòu)
6.3.2 多維聯(lián)機分析處理(MOLAP)結(jié)構(gòu)
6.3.3 混合聯(lián)機分析處理(HOLAP)結(jié)構(gòu)
6.3.4 桌面聯(lián)機分析處理(DOLAP)結(jié)構(gòu)
6.3.5 客戶聯(lián)機分析處理(COLAP)結(jié)構(gòu)
6.4 典型OLAP模型的數(shù)據(jù)組織與應用
6.4.1 ROLAP的數(shù)據(jù)組織與應用
6.4.2 MOIAP的數(shù)據(jù)組織與應用
6.4.3 ROLAP與MOLAP的數(shù)據(jù)組織與應用比較
思考題
習題
討論題
第7章 元數(shù)據(jù)
7.1 數(shù)據(jù)倉庫中元數(shù)據(jù)的重要性
7.1.1 數(shù)據(jù)倉庫的用戶需要元數(shù)據(jù)
7.1.2 數(shù)據(jù)倉庫的開發(fā)者需要元數(shù)據(jù)
7.1.3 數(shù)據(jù)倉庫的管理員需要元數(shù)據(jù)
7.2 關(guān)于數(shù)據(jù)倉庫元數(shù)據(jù)的概念界定
7.3 元數(shù)據(jù)的幾種分類方法
7.3.1 按用途對元數(shù)據(jù)進行分類
7.3.2 按數(shù)據(jù)倉庫功能區(qū)域劃分的元數(shù)據(jù)分類
7.3.3 按元數(shù)據(jù)的活動方式進行分類
7.4 元數(shù)據(jù)的作用
7.5 元數(shù)據(jù)管理的體系結(jié)構(gòu)
7.5.1 集中的方法
7.5.2 分散的方法
7.5.3 分布的方法
思考題
習題
討論題
第三篇 數(shù)據(jù)挖掘
第8章 關(guān)聯(lián)分析
8.1 關(guān)聯(lián)規(guī)則概念
8.1.1 關(guān)聯(lián)規(guī)則的支持度和置信度
8.1.2 關(guān)聯(lián)規(guī)則分類
8.2 關(guān)聯(lián)規(guī)則挖掘算法
8.2.1 Apriori算法
8.2.2 強關(guān)聯(lián)規(guī)則的有效性和可行性問題
習題
討論題
第9章 神經(jīng)網(wǎng)絡算法
9.1 神經(jīng)網(wǎng)絡概念
9.1.1 神經(jīng)網(wǎng)絡原理
9.1.2 人工神經(jīng)網(wǎng)絡
9.2 人工神經(jīng)網(wǎng)絡模型
9.2.1 感知器
9.2.2 帶隱層的人工神經(jīng)網(wǎng)絡
9.3 前饋神經(jīng)網(wǎng)絡
9.3.1 訓練神經(jīng)網(wǎng)絡
9.3.2 后向傳播如何工作
9.3.3 后向傳播算法
9.4 有關(guān)神經(jīng)網(wǎng)絡研究中應該關(guān)注的幾個問題
9.4.1 關(guān)于對神經(jīng)網(wǎng)絡的理解問題
9.4.2 關(guān)于神經(jīng)網(wǎng)絡應用中數(shù)據(jù)準備的問題
9.4.3 影響神經(jīng)網(wǎng)絡模型性能的部分因素
9.4.4 學習神經(jīng)網(wǎng)絡,需要強調(diào)以下幾個問題
習題
討論題
第10章 決策樹算法
10.1 決策樹分類概述
10.1.1 決策樹分類步驟
10.1.2 決策樹分類舉例
10.2 ID3算法
10.2.1 信息論基本原理
10.2.2 ID3算法的基本思想與實例
10.2.3 ID3算法應用中應該關(guān)注的幾個問題
習題
討論題
第11章 聚類分析
11.1 聚類分析概述
11.1.1 聚類分析中的數(shù)據(jù)類型
11.1.2 聚類分析中相異度(相似性、差異度)測度方法
11.2 聚類分析方法
11.2.1 劃分聚類方法
11.2.2 基于密度的聚類方法
11.2.3 聚類分析在數(shù)據(jù)挖掘應用中有待進一步研究的問題
習題
討論題
第四篇 實驗與工具
第12章 數(shù)據(jù)倉庫實驗與工具應用
第13章 神經(jīng)網(wǎng)絡建模實驗與工具應用
第14章 決策樹與關(guān)聯(lián)分析實驗與工具應用
參考文獻
章節(jié)摘錄
在成功連接到該服務器之后將返回AnalysisManager,此時在AnalysisMan-ager出現(xiàn)了剛剛注冊的服務器,如果該服務器在安裝AnalysisServices時選擇了創(chuàng)建示例數(shù)據(jù)庫的話,此時可以看到“FoodMart2000”示例數(shù)據(jù)庫?! ≡诿總€分析服務器上可以創(chuàng)建一個或多個數(shù)據(jù)庫來存儲多維數(shù)據(jù)集、數(shù)據(jù)挖掘模型和相關(guān)對象。應該為每組相關(guān)的計劃創(chuàng)建一個數(shù)據(jù)庫,每個數(shù)據(jù)庫存儲自己的對象,這些對象包括以下內(nèi)容: ?。?)數(shù)據(jù)源。數(shù)據(jù)源包含訪問對象(如多維數(shù)據(jù)集)的源數(shù)據(jù)所必需的信息。一個數(shù)據(jù)庫可以包含多個數(shù)據(jù)源,數(shù)據(jù)庫中的多維數(shù)據(jù)集、分區(qū)和維度共享這些數(shù)據(jù)源?! 。?)多維數(shù)據(jù)集。多維數(shù)據(jù)集即數(shù)據(jù)立方體。一個多維數(shù)據(jù)集只能有一個數(shù)據(jù)源,創(chuàng)建多維數(shù)據(jù)集時,可以從數(shù)據(jù)庫的數(shù)據(jù)源中選擇數(shù)據(jù)源,也可以創(chuàng)建新的數(shù)據(jù)源?! 。?)共享維度。共享維度是可用于多個多維數(shù)據(jù)集的維度。MicrosoftSQLServer2000AnalysisServices包括幾種維度,最常見的劃分是常規(guī)維度、虛擬維度、父子維度和數(shù)據(jù)挖掘維度,其中任何一種維度都可以創(chuàng)建共享維度。共享同一數(shù)據(jù)源的共享維度可以包括在數(shù)據(jù)庫中的任何多維數(shù)據(jù)集中。通過創(chuàng)建共享維度并在多個多維數(shù)據(jù)集中使用,可以節(jié)省大量時間,否則,就要在每個多維數(shù)據(jù)集內(nèi)創(chuàng)建重復的專用維度。 ?。?)數(shù)據(jù)挖掘模型。數(shù)據(jù)挖掘模型是數(shù)據(jù)挖掘的中央對象,是一個虛擬結(jié)構(gòu),它表示關(guān)系或多維數(shù)據(jù)的分組和預測分析。MicrosoftSQLServer2000A-nalysisServices支持兩種數(shù)據(jù)挖掘模型,基于多維數(shù)據(jù)集(數(shù)據(jù)立方體)的挖掘模型和基于關(guān)系數(shù)據(jù)庫的挖掘模型,在AnalysisManager樹形目錄中分別用不同的圖標表示?! 。?)數(shù)據(jù)庫角色。數(shù)據(jù)庫角色包括WindowsNT4.0或Windows2000用戶賬戶和組。通常,數(shù)據(jù)庫角色創(chuàng)建后指派給多維數(shù)據(jù)集或數(shù)據(jù)挖掘模型,授予該角色對多維數(shù)據(jù)集或挖掘模型的訪問權(quán),同時創(chuàng)建一個與數(shù)據(jù)庫角色同名的多維數(shù)據(jù)集或挖掘模型角色用以保存該角色的信息。在數(shù)據(jù)庫角色中,可以控制對數(shù)據(jù)庫中維度的訪問,可以指定角色能夠查看維度的哪些級別和成員。數(shù)據(jù)庫角色是直接從屬于數(shù)據(jù)庫的,一個數(shù)據(jù)庫中的數(shù)據(jù)庫角色僅適用于該數(shù)據(jù)庫和其中的對象。數(shù)據(jù)庫角色可以通過數(shù)據(jù)庫角色管理器和“數(shù)據(jù)庫角色”對話框創(chuàng)建和維護。在AnalysisManager中,右擊“數(shù)據(jù)庫角色”,從彈出菜單中選擇“管理角色”選項,就會彈出數(shù)據(jù)庫角色管理器。角色的每個屬性都可以通過右鍵菜單進行編輯。 ……
圖書封面
評論、評分、閱讀與下載
數(shù)據(jù)倉庫與數(shù)據(jù)挖掘?qū)д?PDF格式下載