出版時間:2012-8 出版社:王珊、 李翠平 高等教育出版社 (2012-08出版) 作者:王珊,李翠平 頁數(shù):222
內(nèi)容概要
數(shù)據(jù)倉庫技術(shù)和數(shù)據(jù)分析技術(shù)是信息領(lǐng)域的核心技術(shù)之一,是基于海量數(shù)據(jù)的決策支持系統(tǒng)體系化環(huán)境的核心。 《普通高等教育“十一五”國家級規(guī)劃教材:數(shù)據(jù)倉庫與數(shù)據(jù)分析教程》詳盡地介紹了數(shù)據(jù)倉庫和數(shù)據(jù)分析技術(shù)的基本概念和基本原理,建立數(shù)據(jù)倉庫和進(jìn)行數(shù)據(jù)分析的方法和過程。全書分為數(shù)據(jù)倉庫技術(shù)篇、聯(lián)機(jī)分析處理技術(shù)篇、數(shù)據(jù)挖掘技術(shù)篇三部分,共10章。附錄中介紹了一些典型的數(shù)據(jù)倉庫產(chǎn)品和工具?! 镀胀ǜ叩冉逃笆晃濉眹壹壱?guī)劃教材:數(shù)據(jù)倉庫與數(shù)據(jù)分析教程》可以作為高等學(xué)校計(jì)算機(jī)專業(yè)、信息管理專業(yè)以及其他相關(guān)專業(yè)本科生和研究生的教材和參考書,也可以作為企事業(yè)單位信息管理部門及相關(guān)行業(yè)從事數(shù)據(jù)庫和數(shù)據(jù)倉庫的研究與開發(fā)人員、數(shù)據(jù)分析人員和管理人員的參考資料。
書籍目錄
第一篇數(shù)據(jù)倉庫技術(shù) 第一章從數(shù)據(jù)庫到數(shù)據(jù)倉庫 1.1數(shù)據(jù)倉庫產(chǎn)生的原因 1.1.1操作型數(shù)據(jù)處理 1.1.2分析型數(shù)據(jù)處理 1.1.3兩種數(shù)據(jù)處理模式的差別 1.1.4數(shù)據(jù)庫系統(tǒng)的局限性 1.2數(shù)據(jù)倉庫的基本概念 1.2.1主題與面向主題 1.2.2數(shù)據(jù)倉庫的其他三個特征 1.2.3數(shù)據(jù)倉庫的功能 1.3數(shù)據(jù)倉庫的體系結(jié)構(gòu) 1.3.1體系結(jié)構(gòu) 1.3.2數(shù)據(jù)集市 小結(jié) 習(xí)題 第二章操作數(shù)據(jù)存儲 2.1什么是ODS 2.1.1ODS的定義及特點(diǎn) 2.1.2ODS的功能和實(shí)現(xiàn)機(jī)制 2.2DB~ODS~DW體系結(jié)構(gòu) 2.2.1ODS與DW 2.2.2DB~ODS~DW三層體系結(jié)構(gòu) 小結(jié) 習(xí)題 第三章數(shù)據(jù)倉庫中的數(shù)據(jù)及組織 3.1數(shù)據(jù)倉庫中的數(shù)據(jù)組織 3.2數(shù)據(jù)倉庫中數(shù)據(jù)的追加 3.3數(shù)據(jù)倉庫中的元數(shù)據(jù) 3.3.1元數(shù)據(jù)的定義 3.3.2元數(shù)據(jù)的分類 3.3.3元數(shù)據(jù)管理的標(biāo)準(zhǔn)化 小結(jié) 習(xí)題 第二篇聯(lián)機(jī)分析處理技術(shù) 第四章概述及模型 4.1OLAP技術(shù)概述 4.1.1OLAP的起源 4.1.2OLAP的定義 4.1.3OLAP與OLTP的區(qū)別 4.1.4OLAP核心技術(shù) 4.2多維數(shù)據(jù)模型 4.2.1基本概念 4.2.2星形、雪片和事實(shí)群模型 4.3多維分析操作 4.3.1多維分析基礎(chǔ):聚集 4.3.2常用多維分析操作 4.3.3其他多維分析操作 4.3.4聚集的一些限制 4.3.5水平層次結(jié)構(gòu)和非水平層次結(jié)構(gòu) 4.4多維查詢語言 4.4.1MDX簡介 4.4.2MDX對象模型 4.5多維數(shù)據(jù)展示 4.5.1三維數(shù)據(jù)展示 4.5.2高維數(shù)據(jù)展示 小結(jié) 習(xí)題 第五章數(shù)據(jù)方體的存儲、預(yù)計(jì)算和縮減 5.1數(shù)據(jù)方體的存儲 5.1.1MOLAP 5.1.2ROLAP 5.1.3MOLAP和ROLAP實(shí)現(xiàn)機(jī)制的比較 5.2數(shù)據(jù)方體的預(yù)計(jì)算 5.2.1預(yù)計(jì)算的相關(guān)概念 5.2.2數(shù)據(jù)方體格結(jié)構(gòu) 5.2.3數(shù)據(jù)方體格存儲方法 5.3完整數(shù)據(jù)方體的預(yù)計(jì)算方法 5.3.1流水線算法 5.3.2BUC算法 5.4部分?jǐn)?shù)據(jù)方體的預(yù)計(jì)算方法 5.4.1BPUS算法 5.4.2PBS算法 5.5數(shù)據(jù)方體的縮減技術(shù) 5.5.1Drawf數(shù)據(jù)方體 5.5.2Condensed數(shù)據(jù)方體 5.5.3Quotient數(shù)據(jù)方體 小結(jié) 習(xí)題 第六章數(shù)據(jù)方體的索引、查詢和維護(hù) 6.1數(shù)據(jù)方體的索引技術(shù) 6.1.1樹索引 6.1.2位圖索引 6.2數(shù)據(jù)方體的查詢處理和優(yōu)化技術(shù) 6.2.1子查詢劃分技術(shù) 6.2.2子查詢處理及優(yōu)化技術(shù) 6.3數(shù)據(jù)方體的維護(hù)技術(shù) 小結(jié) 習(xí)題 第三篇數(shù)據(jù)挖掘技術(shù) 第七章數(shù)據(jù)挖掘概述 7.1數(shù)據(jù)挖掘簡介 7.1.1數(shù)據(jù)挖掘的特點(diǎn) 7.1.2數(shù)據(jù)挖掘與KDD 7.1.3數(shù)據(jù)挖掘與OLAP 7.1.4數(shù)據(jù)挖掘與數(shù)據(jù)倉庫 7.1.5數(shù)據(jù)挖掘的分類 7.1.6數(shù)據(jù)挖掘的應(yīng)用 7.2數(shù)據(jù)挖掘算法的組件化思想 7.2.1模型或模式結(jié)構(gòu) 7.2.2數(shù)據(jù)挖掘的任務(wù) 7.2.3評分函數(shù) 7.2.4搜索和優(yōu)化方法 7.2.5數(shù)據(jù)管理策略 7.2.6組件化思想的應(yīng)用 小結(jié) 習(xí)題 第八章頻繁模式挖掘 8.1頻繁項(xiàng)集和關(guān)聯(lián)規(guī)則 8.1.1問題描述 8.1.2關(guān)聯(lián)規(guī)則分類 8.1.3關(guān)聯(lián)規(guī)則挖掘的經(jīng)典算法Apriori 8.1.4關(guān)聯(lián)規(guī)則挖掘的重要算法FP—Growth 8.1.5其他關(guān)聯(lián)規(guī)則挖掘方法 8.1.6關(guān)聯(lián)規(guī)則的興趣度 8.2序列模式挖掘 8.2.1問題描述 8.2.2GSP算法 8.2.3PrefixSpan算法 8.3頻繁子圖挖掘 8.3.1問題描述 8.3.2基于Apriori的寬度優(yōu)先算法 8.3.3基于FP—Growth的深度優(yōu)先 搜索算法 小結(jié) 習(xí)題 第九章預(yù)測建模:分類和回歸 9.1預(yù)測建模簡介 9.1.1預(yù)測的模型結(jié)構(gòu) 9.1.2用于預(yù)測的評分函數(shù) 9.1.3用于預(yù)測的搜索和優(yōu)化策略 9.2決策樹分類 9.2.1建樹階段 9.2.2剪枝階段 9.2.3分類規(guī)則的生成 9.2.4可擴(kuò)展性問題 9.2.5其他問題 9.3貝葉斯分類 9.3.1基本概念 9.3.2樸素貝葉斯分類 9.4支持向量機(jī)分類 9.4.1線性可分時的二元分類問題 9.4.2線性不可分時的二元分類問題 9.4.3多元分類問題 9.4.4可擴(kuò)展性問題 9.5人工神經(jīng)網(wǎng)絡(luò)分類 9.5.1神經(jīng)網(wǎng)絡(luò)的組成 9.5.2神經(jīng)網(wǎng)絡(luò)的分類方法 小結(jié) 習(xí)題 第十章描述建模:聚類 10.1聚類分析簡介 10.1.1對象間的相似性 10.1.2其他相似性度量 10.2聚類方法概述 10.2.1基于劃分的聚類方法 10.2.2基于密度的聚類方法 10.2.3基于層次的聚類方法 10.2.4.基于模型的聚類方法 10.2.5基于方格的聚類方法 小結(jié) 習(xí)題 附錄產(chǎn)品與工具 附錄AIBM數(shù)據(jù)倉庫解決方案 附錄BOracle數(shù)據(jù)倉庫解決方案 附錄CMicrosoftSQLServer2005數(shù)據(jù)倉庫解決方案 附錄DSybase數(shù)據(jù)倉庫解決方案 附錄EGroup1Sagem介紹 附錄FInformatica介紹 參考文獻(xiàn)
章節(jié)摘錄
版權(quán)頁: 插圖: 2.數(shù)據(jù)存儲 如前所述,MOLAP以多維數(shù)組為主要存儲結(jié)構(gòu),聚集計(jì)算通過數(shù)組下標(biāo)的直接偏移進(jìn)行。ROLAP以傳統(tǒng)的關(guān)系數(shù)據(jù)庫系統(tǒng)為基礎(chǔ),以關(guān)系表為主要存儲結(jié)構(gòu)。 在數(shù)據(jù)的存儲容量上,由于關(guān)系數(shù)據(jù)庫的技術(shù)較為成熟,因此ROLAP占優(yōu)勢,并且可以支持的維數(shù)也較MOLAP多。但值得注意的是,限制MOLAP數(shù)據(jù)量的不是維數(shù),而是數(shù)據(jù)單元數(shù)。如果MOLAP能在數(shù)據(jù)單元的存儲管理上有進(jìn)一步的提高,再輔之以高效的稀疏處理能力,其數(shù)據(jù)量也可以達(dá)到很大。另一點(diǎn)需要注意的是,盡管ROLAP的數(shù)據(jù)容量大,但為了提高分析響應(yīng)速度,須構(gòu)造大量的中間表(即預(yù)綜合,以避免重復(fù)連接),因此數(shù)據(jù)冗余度也大。 3.數(shù)據(jù)存取 在前面已經(jīng)提到,由于ROLAP是用關(guān)系表來模擬多維數(shù)據(jù),因此其存取較MOLAP復(fù)雜。首先用戶的分析請求由ROLAP服務(wù)器轉(zhuǎn)為SQL請求,然后交由RDBMS處理,處理結(jié)果經(jīng)多維處理后返回給用戶,而且SQL并非可以處理所有的多維分析和計(jì)算工作,有些時候只能依賴附加的應(yīng)用程序來完成。而MOLAP可以利用多維查詢語言(如MDX)或其他方式直接將用戶查詢轉(zhuǎn)為MOLAP可以處理的形式,基本不借助附加程序。 4.適應(yīng)性 可以從以下幾個不同方面對MOLAP和ROLAP的適應(yīng)性進(jìn)行比較。 (1)適應(yīng)分析維數(shù)動態(tài)變化 由于MOLAP的預(yù)綜合度相當(dāng)高(85%以上),因而增加一維則數(shù)據(jù)方體的規(guī)模會迅猛增長。而ROLAP的預(yù)綜合度相當(dāng)靈活,大多根據(jù)用戶需要進(jìn)行,一般在85%以下,增加一維意味著增加一些維表及與用戶分析相關(guān)的綜合表,還有事實(shí)表中的相應(yīng)內(nèi)容,相對來說比較容易。 (2)適應(yīng)數(shù)據(jù)變化 同樣,因?yàn)镸OLAP的預(yù)綜合度高,因此當(dāng)數(shù)據(jù)或計(jì)算頻繁變化時,其重新計(jì)算量相當(dāng)大,甚至需要重新構(gòu)建多維數(shù)據(jù)庫。相比而言,ROLAP的預(yù)綜合度低,適應(yīng)數(shù)據(jù)變化的范圍大。 (3)適應(yīng)海量數(shù)據(jù) 由于RDBMS已有20多年的歷史,其技術(shù)上比較成熟,加之近年來并行處理技術(shù)的發(fā)展和應(yīng)用,ROLAP在適應(yīng)海量數(shù)據(jù)上的能力強(qiáng)于MOLAP。 (4)適應(yīng)軟硬件的能力 理由同上,ROLAP在軟硬件上的適應(yīng)力明顯強(qiáng)于MOLAP。 盡管ROLAP在適應(yīng)性方面明顯強(qiáng)于MOLAP,但這種差距是歷史造成的。可以預(yù)見,隨著時間的推移,MOLAP的技術(shù)會不斷成熟,像并行處理等RDBMS上用到的技術(shù)也會逐漸用到MOLAP上來。
編輯推薦
《普通高等教育"十一五"國家級規(guī)劃教材:數(shù)據(jù)倉庫與數(shù)據(jù)分析教程》可以作為高等學(xué)校計(jì)算機(jī)專業(yè)、信息管理專業(yè)以及其他相關(guān)專業(yè)本科生和研究生的教材和參考書,也可以作為企事業(yè)單位信息管理部門及相關(guān)行業(yè)從事數(shù)據(jù)庫和數(shù)據(jù)倉庫的研究與開發(fā)人員、數(shù)據(jù)分析人員和管理人員的參考資料。
圖書封面
評論、評分、閱讀與下載
數(shù)據(jù)倉庫與數(shù)據(jù)分析教程 PDF格式下載