數(shù)據(jù)倉庫設(shè)計

出版時間:2010-8  出版社:清華大學(xué)出版社  作者:(意)戈爾法雪利 等著  頁數(shù):393  
Tag標(biāo)簽:無  

前言

數(shù)據(jù)倉庫設(shè)計是一個重要的課題,是商業(yè)信息的核心,而信息是現(xiàn)代組織的核心,小管組織是一家企業(yè)業(yè)、一家非盈利性組織還是一個政府機構(gòu),信息都具有無比重要的價值。就像生物體需要使用信息一樣,組織需要使用信息來調(diào)節(jié)內(nèi)部操作以及適應(yīng)外部變化。人員組織使用有關(guān)內(nèi)部運營狀況的信息來管理成本及正確地分配資源,使用有關(guān)外部世界的信息來管理客戶和供應(yīng)商,以及應(yīng)塒競爭和市場變化。能夠很好地利用信息的組織往往能夠更加穩(wěn)定地發(fā)展,而不能有效利用信息的組織則在苦苦掙扎?,F(xiàn)在,信息比以往任何時候都更加重要,生成和存儲的信息量浩如煙海。我們面臨著龐人的信息量。我們居住的模擬世界正在逐漸數(shù)字化,而在數(shù)字化的世界中,每個事件都可以被已求、歸類并存儲起來,供以后分析使用。每筆商業(yè)交易、每次網(wǎng)站訪問、每幅查看的圖片、每個打出的電話和花費的每一美元都被數(shù)字化并記錄下來。在過去,購買就是發(fā)生在商店售貨員和顧客之間的“模擬交易”,而現(xiàn)在,相同的交易通過互聯(lián)網(wǎng)或商店的銷售點終端系統(tǒng)進行,并將被立即記錄下來。

內(nèi)容概要

《數(shù)據(jù)倉庫設(shè)計:現(xiàn)代原理與方法》內(nèi)容詳實,圖文并茂,介紹最前沿的數(shù)據(jù)倉庫設(shè)計技術(shù),指導(dǎo)您構(gòu)建安全可靠的決策支持基礎(chǔ)結(jié)構(gòu)。它闡述了遵循成熟可靠的軟件工程原理的實用設(shè)計方法,討論如何得心應(yīng)手地構(gòu)建富有表達力的概念模式、將概念模式轉(zhuǎn)換為關(guān)系模式以及設(shè)計最新ETL過程,還講述如何集成異構(gòu)數(shù)據(jù)源、實現(xiàn)星型和雪花模式、管理動態(tài)和不規(guī)則層次結(jié)構(gòu)以及如何通過實體化和拆分視圖來優(yōu)化性能。

作者簡介

作者:(意大利)戈爾法雪利(Matteo Golfarelli) (意大利)Stefano Rizzi 譯者:戰(zhàn)曉蘇 吳云浩 皮人杰Matteo Golfa relli是意大利博洛尼亞大學(xué)計算機科學(xué)與技術(shù)學(xué)院副教授,講授信息系統(tǒng)、數(shù)據(jù)庫和數(shù)據(jù)挖掘課程。Matteo從2008年開始擔(dān)任Buslrless Intelligence Systems會議的聯(lián)合主席,并仟國際雜志Data Mining and Management的編委。Stefao RiZZi是意大利博洛尼亞大學(xué)計算機科學(xué)與技術(shù)學(xué)院教授,講授高級信息系統(tǒng)和軟件工程課棒。他已在國際期刊和會議文獻上發(fā)表了近1 00篇關(guān)于信息系統(tǒng)、移動機器人系統(tǒng)和模式識別的論文。Stefano是Encyclopedia of Database Systems雜志的數(shù)據(jù)倉庫設(shè)計編輯。

書籍目錄

第1章 數(shù)據(jù)倉庫簡介 1.1 決策支持系統(tǒng) 1.2 數(shù)據(jù)倉庫 1.3 數(shù)據(jù)倉庫的體系結(jié)構(gòu)  1.3.1 單層體系結(jié)構(gòu)  1.3.2 兩層體系結(jié)構(gòu)  1.3.3 三層體系結(jié)構(gòu)  1.3.4 另一種體系結(jié)構(gòu)類別 1.4 數(shù)據(jù)準(zhǔn)備和ETL  1.4.1 提取  1.4.2 清洗  1.4.3 轉(zhuǎn)換  1.4.4 加載 1.5 多維模型  1.5.1 限制  1.5.2 聚合 1.6 元數(shù)據(jù)  1.7 訪問數(shù)據(jù)倉庫  1.7.1 報表  1.7.2 0LAP  1.7.3 儀表板 1.8 ROLAP、MOLAP和HOLAP 1.9 其他問題  1.9.1 質(zhì)量  1.9.2 安全  1.9.3 進化第2章 數(shù)據(jù)倉庫系統(tǒng)的生命周期 2.1 風(fēng)險因素 2.2 自上而下與自下而上  2.2.1 商業(yè)維度生命周期  2.2.2 快遞數(shù)據(jù)倉庫方法 2.3 數(shù)據(jù)集市設(shè)計階段  2.3.1 數(shù)據(jù)源的分析和協(xié)調(diào)  2.3.2 需求分析  2.3.3 概念設(shè)計  2.3.4 工作負荷細化和概念模式的驗證  2.3.5 邏輯設(shè)計  2.3.6 物理設(shè)計  2.3.7 數(shù)據(jù)準(zhǔn)備設(shè)計 2.4 系統(tǒng)方法架構(gòu)  2.4.1 場景1:數(shù)據(jù)驅(qū)動的方法  2.4.2 場景2:需求驅(qū)動的方法  2.4.3 場景3:混合方法 2.5 測試數(shù)據(jù)集市第3章 數(shù)據(jù)源的分析與協(xié)調(diào) 3.1 檢查和規(guī)范化模式 3.2 集成問題  3.2.1 不同視角  3.2.2 等效建模構(gòu)造  3.2.3 不兼容的規(guī)范  3.2.4 共有概念  3.2.5 相互關(guān)聯(lián)的概念 3.3 集成階段  3.3.1 預(yù)集成  3.3.2 比較模式  3.3.3 對齊模式  3.3.4 合并和重構(gòu)模式 3.4 定義映射第4章 用戶需求分析 4.1 采訪 4.2 基于詞匯表的需求分析  4.2.1 事實  4.2.2 預(yù)備性工作負荷 4.3 面向目標(biāo)的需求分析  4.3.1 Tropos簡介  4.3.2 組織建模  4.3.3 決策建?!?.4 其他要求第5章 概念建?!?.1 維度事實模型:基本概念 5.2 高級建?! ?.2.1 描述性屬性  5.2.2 跨維度屬性  5.2.3 聚合  5.2.4 共享層次結(jié)構(gòu)  5.2.5 多弧線  5.2.6 可N選弧線  5.2.7 不完整層次結(jié)構(gòu)  5.2.8 遞歸層次結(jié)構(gòu)  5.2.9 可加性 5.3 事件和聚合  5.3.1 聚合可加性度量  5.3.2 聚合不可加度量  5.3.3 使用聚合和跨維度屬性聚合  5.3.4 使用可選弧線或者多弧線聚合  5.3.5 空事實模式聚合  5.3.6 使用維度間的函數(shù)依賴進行聚合  5.3.7 沿著不完整或者遞歸層次結(jié)構(gòu)聚合 5.4 時間  5.4.1 事務(wù)模式與快照模式  5.4.2 遲更新  5.4.3 動態(tài)層次結(jié)構(gòu) 5.5 重疊事實模式 5.6 正式化維度事實模式  5.6.1 元模型  5.6.2 內(nèi)涵特性  5.6.3 外延特性第6章 概念設(shè)計 6.1 基于實體-關(guān)系模式的設(shè)計  6.1.1 定義事實  6.1.2 構(gòu)建屬性樹  6.1.3 修剪和移植屬性樹  6.1.4 一對一關(guān)系  6.1.5 定義維度  6.1.6 時間維度  6.1.7 定義度量  6.1.8 生成事實模式 6.2 基于關(guān)系模式的設(shè)計  6.2.1 定義事實  6.2.2 構(gòu)建屬性樹  6.2.3 其他階段 6.3 基于XML模式的設(shè)計  6.3.1 建立XML關(guān)聯(lián)模型  6.3.2 預(yù)備階段  6.3.3 選擇事實并構(gòu)建屬性樹 6.4 混合方法設(shè)計  6.4.1 映射需求  6.4.2 構(gòu)建事實模式  6.4.3 細化 6.5 需求驅(qū)動的方法設(shè)計第7章 工作負荷和數(shù)據(jù)卷 7.1 工作負荷  7.1.1 維度表達式和對事實模式的查詢  7.1.2 橫向鉆取查詢  7.1.3 復(fù)合查詢  7.1.4 嵌套GPSJ查詢  7.1.5 驗證概念模式中的工作負荷  7.1.6 工作負荷和用戶 7.2 數(shù)據(jù)卷第8章 邏輯建?!?.1 MOLAP和HOLAP系統(tǒng) 8.2 ROLAP系統(tǒng)  8.2.1 星型模式  8.2.2 雪花模式 8.3 視圖 8.4 時間場景  8.4.1 動態(tài)層次結(jié)構(gòu):類型1  8.4.2 動態(tài)層次結(jié)構(gòu):類型2  8.4.3 動態(tài)層次結(jié)構(gòu):類型3  8.4.4 動態(tài)層次結(jié)構(gòu):完整數(shù)據(jù)記錄  8.4.5 刪除元組第9章 邏輯設(shè)計 9.1 事實模式到星型模式  9.1.1 描述性屬性  9.1.2 跨維度屬性  9.1.3 共享層次結(jié)構(gòu)  9.1.4 多弧線  9.1.5 可選選弧線  9.1.6 不完整層次結(jié)構(gòu)  9.1.7 遞歸層次結(jié)構(gòu)  9.1.8 退化維度  9.1.9 可加性問題  9.1.10 使用雪花模式 9.2 視圖實體化  9.2.1 使用視圖來回答查詢  9.2.2 問題公式化  9.2.3 實體化算法 9.3 視圖碎片化  9.3.1 垂直視圖碎片化  9.3.2 水平視圖碎片化第10章 數(shù)據(jù)準(zhǔn)備設(shè)計 10.1 填充協(xié)調(diào)數(shù)據(jù)庫  10.1.1 提取數(shù)據(jù)  10.1.2 轉(zhuǎn)換數(shù)據(jù)  10.1.3 加載數(shù)據(jù) 10.2 清洗數(shù)據(jù)  10.2.1 基于字典的技術(shù)  10.2.2 近似合并  10.2.3 即席技術(shù) 10.3 填充維度表  10.3.1 確定要加載的數(shù)據(jù)  10.3.2 替換鍵 10.4 填充事實表 10.5 填充實體化視圖第11章 數(shù)據(jù)倉庫的索引 11.1 B+樹索引 11.2 位圖索引  11.2.1 位圖索引與B+樹  11.2.2 高級位圖索引 11.3 投影索引 11.4 聯(lián)接和星型索引 11.5 空間索引 11.6 聯(lián)接算法  11.6.1 嵌套循環(huán)  11.6.2 排序一合并  11.6.3 哈希聯(lián)接第12章 物理設(shè)計  12.1 優(yōu)化器  12.1.1 基于規(guī)則的優(yōu)化器  12.1.2 基于開銷的優(yōu)化器  12.1.3 直方圖 12.2 選擇索引  12.2.1 索引維度表  12.2.2 索引事實表 12.3 其他物理設(shè)計元素  12.3.1 將數(shù)據(jù)庫劃分為表空間  12.3.2 分配數(shù)據(jù)文件  12.3.3 磁盤塊大小第13章 數(shù)據(jù)倉庫項目文檔 13.1 數(shù)據(jù)倉庫層  13.1.1 數(shù)據(jù)倉庫模式  13.1.2 部署模式 13.2 數(shù)據(jù)集市層  13.2.1 總線矩陣和重疊矩陣  13.2.2 操作模式  13.2.3 數(shù)據(jù)準(zhǔn)備模式  13.2.4 域術(shù)語表  13.2.5 工作負荷和用戶  13.2.6 邏輯模式和物理模式  13.2.7 測試文檔 13.3 事實層  13.3.1 事實模式  13.3.2 屬性和度量術(shù)語表 13.4 系統(tǒng)方法指導(dǎo)原則第14章 案例研究 14.1 應(yīng)用領(lǐng)域 14.2 計劃TranSport數(shù)據(jù)倉庫 14.3 銷售數(shù)據(jù)集市  14.3.1 數(shù)據(jù)源分析和協(xié)調(diào)  14.3.2 用戶需求分析  14.3.3 概念設(shè)計  14.3.4 邏輯設(shè)計  14.3.5 數(shù)據(jù)準(zhǔn)備設(shè)計  14.3.6 物理設(shè)計 14.4 營銷數(shù)據(jù)集市第15章 超越數(shù)據(jù)倉庫范疇的商業(yè)智能 15.1 商業(yè)智能簡介 15.2 數(shù)據(jù)挖掘  15.2.1 關(guān)聯(lián)規(guī)則  15.2.2 群集化  15.2.3 分類器和決策樹  15.2.4 時間序列 15.3 假設(shè)分析  15.3.1 歸納技術(shù)  15.3.2 演繹技術(shù)  15.3.3 系統(tǒng)方法注意事項 15.4 商業(yè)績效管理術(shù)語表參考文獻

章節(jié)摘錄

插圖:數(shù)據(jù)倉庫層是本書重點討論的部分。我們在這里引入一個數(shù)據(jù)倉庫的關(guān)鍵字:多維。您需要熟悉這里使用的概念和術(shù)語才能理解本書中講解的信息,尤其是關(guān)于概念和邏輯建模及設(shè)計的信息。在過去幾年中,多維數(shù)據(jù)庫已經(jīng)引起了很大的研究和市場興趣,因為對于許多決策制定支持應(yīng)用程序(比如數(shù)據(jù)倉庫系統(tǒng)),它們起著奠基性的作用。多維模型用作數(shù)據(jù)倉庫數(shù)據(jù)表示范式的根本原因是它易于使用并且很直觀,即使對于IT新手也是如此。多維模型的成功也與采用多維模型作為可視化范式的生產(chǎn)工具(比如電子表格)的廣泛應(yīng)用有關(guān)??赡苡行У亓私舛嗑S模型的最佳起點是定義這種模型最適用的查詢的類型。1.7節(jié)提供了關(guān)于典型的決策查詢的更多細節(jié),比如下面的查詢(Jarkeeta1.2000):“去年記錄的每個州和每個產(chǎn)品類別的總收入額為多少?”“過去5年中PC廠商的份額與季度收入之間的關(guān)系是什么?”“哪些訂單可以實現(xiàn)收入的最大化?”“兩種治療方法中哪一種會造成平均住院時間的下降?”“包含少于10件物品的配送帶來的利潤與包含多于10件物品的配送帶來的利潤之間的關(guān)系是什么?”

編輯推薦

《數(shù)據(jù)倉庫設(shè)計:現(xiàn)代原理與方法》:使用數(shù)據(jù)和需求驅(qū)動的方法創(chuàng)建協(xié)調(diào)數(shù)據(jù)庫來完善數(shù)據(jù)集市架構(gòu)采集并明確表達終端用戶要求使用維度事實模型構(gòu)建概念數(shù)據(jù)集市模式評估數(shù)據(jù)集市卷和負載使用高級邏輯建模技術(shù)提升性能提取、轉(zhuǎn)換、清洗及加載數(shù)據(jù)源的數(shù)據(jù)使用高級索引技術(shù)優(yōu)化查詢執(zhí)行計劃編寫完整的數(shù)據(jù)倉庫項目文檔了解創(chuàng)新商業(yè)智能技術(shù)

圖書封面

圖書標(biāo)簽Tags

評論、評分、閱讀與下載


    數(shù)據(jù)倉庫設(shè)計 PDF格式下載


用戶評論 (總計33條)

 
 

  •   很好,數(shù)據(jù)倉庫現(xiàn)代理論,很實用,值得收藏。
  •   書的內(nèi)容還沒看,只看了目錄和瀏覽了一下,不錯,比較基礎(chǔ)
  •   感覺還可以,很實用!
  •   感覺還不錯,不過就有這本書是不是有點老了?關(guān)于報表工具,冒似都沒有介紹cognos,里面有BO,brio等介紹,沒有介紹cognos,至少目前還沒有看到,繼續(xù)往下看
  •   簡要瀏覽了下內(nèi)容,發(fā)現(xiàn)還是很理論化的
  •   讀了一些,感覺挺有用
  •   個人認為這本書對初學(xué)者幫助很大
  •   理論學(xué)習(xí)挺不錯
  •   還不錯,有收獲!
  •   給我男友買的,他說這本書寫覆蓋面比較全面,但是尚未來得及細看。感覺整體還不錯。
  •   書質(zhì)量還好,但是太學(xué)術(shù)了。
  •   了解數(shù)據(jù)倉庫的設(shè)計和原理,有了一定認識
  •   詳細介紹了數(shù)據(jù)倉庫設(shè)計的完整過程,有借鑒的意義。
  •   一些概念介紹的很清楚。
    看起來比較有感覺!夠具體,實在,不像有些書,虛的不得了,看了跟沒看一樣。
  •   內(nèi)容豐富,印刷一般,翻譯不錯。
  •   有點看不懂啊 講的太深奧了
  •   公司集體訂購的 很專業(yè)的一本書
  •   有點難度,得好好用心研究
  •   學(xué)術(shù)味比較濃
  •   比較深的講解,暫時沒有怎么看
  •   內(nèi)容比較粗淺,幫助不大
  •   講的不錯,很好的教科書
  •   書質(zhì)量不錯,好好讀一讀。
  •   圖書質(zhì)量老舊,懷疑是舊書。要求退貨。
  •   不適合工作的用,倒適合研究生以上學(xué)生用
  •   理論的東西很重要,需要學(xué)習(xí)
  •   這是我看到翻譯過來的技術(shù)書中最差的一本書,讀起來太累人了,雖然介紹的內(nèi)容不錯,但是讀起來有點暈頭轉(zhuǎn)向的。這是我買的最失敗的一本書了。
  •   翻譯的有點晦澀,讀起來比較痛苦
  •   很適合入門的一本書.由淺入深.尤其是概念建模講得非常好.
  •   第三版一出來,毫不猶豫的拿下,哈哈!
  •   封面看上去很專業(yè)
  •   剛到貨,感覺還可以。
  •   第一次買數(shù)據(jù)倉庫方面的書
 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7