Microsoft數(shù)據(jù)倉(cāng)庫(kù)工具箱

出版時(shí)間:2012-5  出版社:清華大學(xué)出版社  作者:[美] Joy Mundy  頁(yè)數(shù):460  字?jǐn)?shù):736000  譯者:包戰(zhàn),孔祥亮  
Tag標(biāo)簽:無(wú)  

內(nèi)容概要

  作為數(shù)據(jù)倉(cāng)庫(kù)和商業(yè)智能領(lǐng)域最有影響力的思想領(lǐng)袖,KimballGroup開(kāi)發(fā)了一系列開(kāi)拓性的技術(shù),均已成為DW/BI系統(tǒng)設(shè)計(jì)、開(kāi)發(fā)和管理的業(yè)界標(biāo)準(zhǔn)。在這本暢銷書的新版本中,KimballGroup中經(jīng)驗(yàn)豐富的專家介紹了如何快速掌握SQLServer的新商業(yè)智能版本:SQLServer2008R2。
  《Microsoft數(shù)據(jù)倉(cāng)庫(kù)工具箱(第2版)--使用SQLSever2008R2和MicrosoftBI工具集》涵蓋了SQLServer2008R2中全套的數(shù)據(jù)倉(cāng)庫(kù)和BI工具,介紹了項(xiàng)日的整個(gè)生命周期,包括設(shè)計(jì)、開(kāi)發(fā)、部署和維護(hù)?!禡icrosoft數(shù)據(jù)倉(cāng)庫(kù)工具箱(第2版)——使用SQLSever2008R2和MicrosoftBI工具集》更新了上一版的大量?jī)?nèi)容,介紹了SQLServer2008R2的新功能,例如PowerPivot和MasterDataServices,還用翔實(shí)的示例說(shuō)明如何更好地應(yīng)用《Microsoft數(shù)據(jù)倉(cāng)庫(kù)工具箱(第2版):使用SQL
Server 2008 R2和Microsoft BI工具集》描述的技術(shù)。
  作者分享了他們使用Microsoft工具構(gòu)建DW/BI系統(tǒng)的經(jīng)驗(yàn),讀者可以從中了解他們遇到的挑戰(zhàn),分享他們的成功。還可以學(xué)習(xí)在使用Kimball生命周期建立自己的DW/BI系統(tǒng)時(shí),應(yīng)如何遵循4個(gè)基本原則:關(guān)注業(yè)務(wù),構(gòu)建信息基礎(chǔ)架構(gòu),提供有意義的增量?jī)r(jià)值以及交付完整的解決方案。有了這4個(gè)原則,就可以構(gòu)建成功的DW/BI系統(tǒng),以支持大多數(shù)公司都有的商業(yè)智能需求。

作者簡(jiǎn)介

  Joy Mundy在斯坦福大學(xué)、WebTV和Microsoft SQL
Server產(chǎn)品研發(fā)小組中一直關(guān)注DW/BI系統(tǒng)。Joy在塔夫茨大學(xué)獲得經(jīng)濟(jì)學(xué)學(xué)士學(xué)位,然后在斯坦福大學(xué)獲得工程經(jīng)濟(jì)系統(tǒng)碩士學(xué)位。
  Warren
Thornthwaite自1980年起就開(kāi)始了DW/BI生涯。在離開(kāi)Metaphor咨詢公司后,他為斯坦福大學(xué)和WebTV工作。Warren從密西根州立大學(xué)獲得傳媒學(xué)的學(xué)士學(xué)位,從賓夕法尼亞州的沃頓商學(xué)院獲得決策學(xué)的MBA學(xué)位。
  Ralph Kimball是Kimball
Group的創(chuàng)立者,自從20世紀(jì)80年代中期開(kāi)始,他就是DW/BI行業(yè)中維度方法的思想領(lǐng)袖。

書籍目錄

第ⅰ部分 需求、現(xiàn)實(shí)情況和體系結(jié)構(gòu)
第1章 定義業(yè)務(wù)需求
1.1 長(zhǎng)期成功的最重要的決定因素
1.2 adventure works cycles簡(jiǎn)介
1.3 揭示業(yè)務(wù)價(jià)值
1.3.1 獲得贊助商關(guān)系
1.3.2 定義企業(yè)級(jí)業(yè)務(wù)需求
1.4 設(shè)定業(yè)務(wù)需求的優(yōu)先級(jí)
1.5 項(xiàng)目規(guī)劃
1.6 收集項(xiàng)目需求
1.7 小結(jié)
第2章 業(yè)務(wù)過(guò)程維度模型設(shè)計(jì)
2.1 維度建模概念和術(shù)語(yǔ)
2.1.1 事實(shí)表
2.1.2 維度
2.1.3 整合事實(shí)和維度
2.1.4 總線矩陣、一致性維度和交叉探查
2.2 其他設(shè)計(jì)概念和技術(shù)
2.2.1 代理鍵
2.2.2 漸變維度
2.2.3 日期
2.2.4 退化維度
2.2.5 雪花模型
2.2.6 多對(duì)多維度或多值維度
2.2.7 層次結(jié)構(gòu)
2.2.8 聚合維度
2.2.9 無(wú)意義維度
2.2.10 3種事實(shí)表類型
2.2.11 聚合
2.3 維度建模過(guò)程
2.3.1 準(zhǔn)備工作
2.3.2 數(shù)據(jù)剖析和研究
2.3.3 構(gòu)建維度模型
2.3.4 開(kāi)發(fā)詳細(xì)維度模型
2.3.5 模型測(cè)試和細(xì)化
2.3.6 評(píng)審和驗(yàn)證模型
2.4 案例研究:adventure works cycles訂單維度模型
2.4.1 訂單事實(shí)表
2.4.2 維度
2.4.3 確定訂單業(yè)務(wù)過(guò)程的維度屬性和事實(shí)
2.4.4 初始訂單模型的最終草圖
2.4.5 詳細(xì)訂單維度模型開(kāi)發(fā)
2.4.6 最終的維度模型
2.5 小結(jié)
第3章 工具集
3.1 microsoft dw/bi 工具集
3.2 使用microsoft工具集的原因
3.3 microsoft dw/bi系統(tǒng)的體系結(jié)構(gòu)
3.3.1 包含analysis services的原因
3.3.2 存儲(chǔ)在關(guān)系數(shù)據(jù)庫(kù)中的原因
3.3.3 etl不是可選的
3.3.4 master data services的作用
3.3.5 交付bi應(yīng)用程序
3.4 microsoft工具概述
3.4.1 需要的產(chǎn)品
3.4.2 sql server開(kāi)發(fā)和管理工具
3.5 小結(jié)
第4章 系統(tǒng)設(shè)置
4.1 系統(tǒng)規(guī)模的考慮事項(xiàng)
4.1.1 計(jì)算數(shù)據(jù)卷
4.1.2 確定應(yīng)用復(fù)雜度
4.1.3 估計(jì)并發(fā)用戶數(shù)
4.1.4 評(píng)估系統(tǒng)可用性需求
4.1.5 系統(tǒng)的規(guī)模
4.2 系統(tǒng)配置考慮事項(xiàng)
4.2.1 內(nèi)存
4.2.2 一體化還是分布式
4.2.3 存儲(chǔ)系統(tǒng)考慮事項(xiàng)
4.2.4 處理器
4.2.5 高可用性設(shè)置
4.3 軟件安裝和配置
4.3.1 開(kāi)發(fā)環(huán)境的軟件需求
4.3.2 測(cè)試和產(chǎn)品系統(tǒng)的軟件需求
4.3.3 操作系統(tǒng)
4.3.4 sql server關(guān)系數(shù)據(jù)庫(kù)設(shè)置
4.3.5 analysis services設(shè)置
4.3.6 integration services設(shè)置
4.3.7 reporting services設(shè)置
4.4 小結(jié)
第ⅱ部分 建立和填充數(shù)據(jù)庫(kù)
第5章 創(chuàng)建關(guān)系數(shù)據(jù)倉(cāng)庫(kù)
5.1 開(kāi)始
5.2 完成物理設(shè)計(jì)
5.2.1 代理鍵
5.2.2 字符串列
5.2.3 空或非空
5.2.4 常規(guī)事務(wù)列
5.2.5 數(shù)據(jù)表和列的擴(kuò)展屬性
5.3 定義存儲(chǔ)器并創(chuàng)建約束和支持對(duì)象
5.3.1 創(chuàng)建文件和文件組
5.3.2 數(shù)據(jù)壓縮
5.3.3 實(shí)體和引用完整性約束
5.3.4 初始索引和數(shù)據(jù)庫(kù)統(tǒng)計(jì)
5.3.5 聚合表
5.3.6 創(chuàng)建數(shù)據(jù)表視圖
5.3.7 插入未知成員行
5.3.8 create table語(yǔ)句示例
5.4 分區(qū)表
5.4.1 分區(qū)表的工作方式
5.4.2 管理分區(qū)表
5.5 收尾
5.5.1 中間表
5.5.2 元數(shù)據(jù)設(shè)置
5.6 小結(jié)
第6章 主數(shù)據(jù)的管理
6.1 管理主引用數(shù)據(jù)
6.1.1 屬性不完整
6.1.2 數(shù)據(jù)集成
6.1.3 系統(tǒng)集成
6.1.4 主數(shù)據(jù)管理系統(tǒng)和數(shù)據(jù)倉(cāng)庫(kù)
6.2 sql server主數(shù)據(jù)服務(wù)
6.2.1 模型定義功能
6.2.2 數(shù)據(jù)管理功能
6.3 創(chuàng)建簡(jiǎn)單的應(yīng)用程序
6.3.1 業(yè)務(wù)場(chǎng)景
6.3.2 盡可能簡(jiǎn)單
6.3.3 創(chuàng)建mds模型
6.3.4 加載子類別成員
6.3.5 改進(jìn)模型
6.3.6 導(dǎo)出到數(shù)據(jù)倉(cāng)庫(kù)
6.4 小結(jié)
第7章 設(shè)計(jì)和開(kāi)發(fā)etl系統(tǒng)
7.1 確定需求
7.2 制定etl計(jì)劃
7.3 sql server integration services概述
7.3.1 控制流和數(shù)據(jù)流
7.3.2 ssis程序包的體系結(jié)構(gòu)
7.4 etl的主要子系統(tǒng)
7.5 提取數(shù)據(jù)
7.5.1 子系統(tǒng)1:數(shù)據(jù)剖析
7.5.2 子系統(tǒng)2:更改數(shù)據(jù)捕獲系統(tǒng)
7.5.3 子系統(tǒng)3:提取系統(tǒng)
7.6 清理和一致化數(shù)據(jù)
7.6.1 子系統(tǒng)4:數(shù)據(jù)清理系統(tǒng)
7.6.2 子系統(tǒng)5:錯(cuò)誤事件模式
7.6.3 子系統(tǒng)6:審核維度匯編器
7.6.4 子系統(tǒng)7:重復(fù)數(shù)據(jù)刪除系統(tǒng)
7.6.5 子系統(tǒng)8:一致化系統(tǒng)
7.7 傳遞數(shù)據(jù)以用于展示
7.7.1 子系統(tǒng)9:漸變維度管理器
7.7.2 子系統(tǒng)10:代理鍵生成器
7.7.3 子系統(tǒng)11:層次結(jié)構(gòu)管理器
7.7.4 子系統(tǒng)12:特殊維度管理器
7.7.5 子系統(tǒng)13:事實(shí)表構(gòu)建器
7.7.6 子系統(tǒng)14:代理鍵管道
7.7.7 子系統(tǒng)15:多值維度橋接表構(gòu)建器
7.7.8 子系統(tǒng)16:遲到數(shù)據(jù)的處理程序
7.7.9 子系統(tǒng)17:維度管理器
7.7.10 子系統(tǒng)18:事實(shí)提供程序系統(tǒng)
7.7.11 子系統(tǒng)19:聚合構(gòu)建器
7.7.12 子系統(tǒng)20:olap多維數(shù)據(jù)集構(gòu)建器
7.7.13 子系統(tǒng)21:數(shù)據(jù)傳播管理器
7.8 管理etl環(huán)境
7.9 小結(jié)
第8章 核心analysis services olap數(shù)據(jù)庫(kù)
8.1 analysis services olap概述
8.1.1 使用analysis services的原因
8.1.2 不使用analysis services的原因
8.2 設(shè)計(jì)olap結(jié)構(gòu)
8.2.1 規(guī)劃
8.2.2 起始工作
8.2.3 創(chuàng)建項(xiàng)目和數(shù)據(jù)源視圖
8.2.4 維度設(shè)計(jì)
8.2.5 創(chuàng)建和編輯維度
8.2.6 創(chuàng)建和編輯多維數(shù)據(jù)集
8.3 物理設(shè)計(jì)的考慮因素
8.3.1 理解存儲(chǔ)模式
8.3.2 分區(qū)計(jì)劃
8.3.3 設(shè)計(jì)性能聚合
8.3.4 部署計(jì)劃
8.3.5 處理整個(gè)多維數(shù)據(jù)集
8.3.6 開(kāi)發(fā)增量處理計(jì)劃
8.4 小結(jié)
第9章 實(shí)時(shí)商業(yè)智能的設(shè)計(jì)需求
9.1 實(shí)時(shí)分類
9.1.1 實(shí)時(shí)的含義
9.1.2 需要實(shí)時(shí)的人員
9.1.3 對(duì)實(shí)時(shí)的權(quán)衡
9.2 場(chǎng)景和解決方案
9.2.1 實(shí)時(shí)地執(zhí)行報(bào)表
9.2.2 通過(guò)緩存向報(bào)表提供服務(wù)
9.2.3 用鏡像和快照創(chuàng)建ods
9.2.4 用復(fù)制功能創(chuàng)建ods
9.2.5 建立biztalk應(yīng)用程序
9.2.6 建立實(shí)時(shí)關(guān)系分區(qū)
9.3 小結(jié)
第ⅲ部分 商業(yè)智能應(yīng)用程序的開(kāi)發(fā)
第10章 在reporting services中構(gòu)建bi應(yīng)用程序
10.1 bi應(yīng)用程序概述
10.2 商業(yè)智能應(yīng)用程序的價(jià)值
10.3 報(bào)表設(shè)計(jì)高層次的體系結(jié)構(gòu)
10.3.1 回顧報(bào)表設(shè)計(jì)的業(yè)務(wù)需求
10.3.2 reporting services的體系結(jié)構(gòu)
10.3.3 使用reporting services作為標(biāo)準(zhǔn)的報(bào)表設(shè)計(jì)工具
10.3.4 reporting services的評(píng)價(jià)
10.4 報(bào)表設(shè)計(jì)系統(tǒng)的設(shè)計(jì)和開(kāi)發(fā)過(guò)程
10.4.1 報(bào)表設(shè)計(jì)系統(tǒng)的設(shè)計(jì)
10.4.2 報(bào)表設(shè)計(jì)系統(tǒng)的開(kāi)發(fā)
10.5 報(bào)表的構(gòu)建和傳送
10.5.1 規(guī)劃和準(zhǔn)備
10.5.2 創(chuàng)建報(bào)表
10.5.3 報(bào)表設(shè)計(jì)的運(yùn)行
10.6 即席報(bào)表設(shè)計(jì)選項(xiàng)
10.6.1 報(bào)表模型
10.6.2 共享數(shù)據(jù)集
10.6.3 報(bào)表部件
10.7 小結(jié)
第11章 powerpivot和excel
11.1 使用excel進(jìn)行分析和報(bào)表設(shè)計(jì)
11.2 powerpivot體系結(jié)構(gòu)
11.3 創(chuàng)建和使用powerpivot數(shù)據(jù)庫(kù)
11.3.1 開(kāi)始使用powerpivot
11.3.2 powerpivot表的設(shè)計(jì)
11.3.3 使用powerpivot創(chuàng)建分析表
11.3.4 powerpivot for excel的觀察和指導(dǎo)原則
11.4 powerpivot for sharepoint
11.4.1 powerpivot sharepoint用戶體驗(yàn)
11.4.2 服務(wù)器級(jí)別的資源
11.4.3 powerpivot的監(jiān)控和管理
11.5 powerpivot在托管dw/bi環(huán)境下的作用
11.6 小結(jié)
第12章 bi門戶和sharepoint
12.1 bi門戶
12.1.1 bi門戶的規(guī)劃
12.1.2 對(duì)設(shè)計(jì)的影響
12.1.3 業(yè)務(wù)過(guò)程的類別
12.1.4 額外的功能
12.1.5 建立bi門戶
12.2 把sharepoint用作bi門戶
12.2.1 體系結(jié)構(gòu)和概念
12.2.2 安裝sharepoint
12.2.3 安裝測(cè)試系統(tǒng)
12.2.4 完成bi門戶
12.2.5 biportal站點(diǎn)模板的其他功能
12.2.6 研究sharepoint
12.3 小結(jié)
第13章 數(shù)據(jù)挖掘的加入
13.1 數(shù)據(jù)挖掘的定義
13.1.1 基本的數(shù)據(jù)挖掘術(shù)語(yǔ)
13.1.2 數(shù)據(jù)挖掘的業(yè)務(wù)應(yīng)用
13.1.3 角色和責(zé)任
13.2 sql server數(shù)據(jù)挖掘體系結(jié)構(gòu)概述
13.2.1 數(shù)據(jù)挖掘設(shè)計(jì)環(huán)境
13.2.2 構(gòu)建、部署和處理
13.2.3 挖掘模型的訪問(wèn)
13.2.4 integration services和數(shù)據(jù)挖掘
13.2.5 其他功能
13.2.6 體系結(jié)構(gòu)的總結(jié)
13.3 microsoft數(shù)據(jù)挖掘的算法
13.3.1 決策樹
13.3.2 na?ve bayes算法
13.3.3 群集
13.3.4 順序群集
13.3.5 時(shí)間序列
13.3.6 關(guān)聯(lián)
13.3.7 神經(jīng)網(wǎng)絡(luò)
13.4 數(shù)據(jù)挖掘的過(guò)程
13.4.1 業(yè)務(wù)階段
13.4.2 數(shù)據(jù)挖掘階段
13.4.3 操作階段
13.4.4 元數(shù)據(jù)
13.5 數(shù)據(jù)挖掘的示例
13.5.1 案例研究:給城市分類
13.5.2 案例研究:產(chǎn)品推薦
13.6 小結(jié)
第ⅳ部分 dw/bi系統(tǒng)的部署和管理
第14章 設(shè)計(jì)和實(shí)施安全保護(hù)
14.1 確定安全管理員
14.2 保護(hù)硬件和操作系統(tǒng)
14.2.1 保護(hù)操作系統(tǒng)
14.2.2 使用windows集成安全認(rèn)證
14.3 保護(hù)開(kāi)發(fā)環(huán)境
14.4 保護(hù)數(shù)據(jù)
14.4.1 向內(nèi)部用戶提供開(kāi)放的訪問(wèn)
14.4.2 分條列出敏感數(shù)據(jù)
14.4.3 保護(hù)各種類型的數(shù)據(jù)訪問(wèn)
14.5 保護(hù)dw/bi系統(tǒng)的組件
14.5.1 reporting services安全
14.5.2 analysis services的安全
14.5.3 關(guān)系dw的安全
14.5.4 integration services安全
14.6 使用情況的監(jiān)控
14.7 小結(jié)
第15章 元數(shù)據(jù)規(guī)劃
15.1 元數(shù)據(jù)的基礎(chǔ)
15.1.1 元數(shù)據(jù)的目標(biāo)
15.1.2 元數(shù)據(jù)種類
15.1.3 元數(shù)據(jù)庫(kù)
15.2 元數(shù)據(jù)標(biāo)準(zhǔn)
15.3 sql server 2008 r2元數(shù)據(jù)
15.3.1 跨工具組件
15.3.2 關(guān)系引擎的元數(shù)據(jù)
15.3.3 analysis services
15.3.4 integration services
15.3.5 reporting services
15.3.6 master data services
15.3.7 sharepoint
15.3.8 外部元數(shù)據(jù)的源
15.3.9 對(duì)sql server元數(shù)據(jù)的期待
15.4 實(shí)用的元數(shù)據(jù)方法
15.4.1 元數(shù)據(jù)策略的創(chuàng)建
15.4.2 業(yè)務(wù)元數(shù)據(jù)報(bào)表
15.4.3 過(guò)程元數(shù)據(jù)報(bào)表設(shè)計(jì)
15.4.4 技術(shù)元數(shù)據(jù)報(bào)表
15.4.5 過(guò)程元數(shù)據(jù)的管理
15.5 小結(jié)
第16章 部署
16.1 建立環(huán)境
16.2 測(cè)試
16.2.1 開(kāi)發(fā)測(cè)試
16.2.2 系統(tǒng)測(cè)試
16.2.3 數(shù)據(jù)質(zhì)量保證的測(cè)試
16.2.4 性能測(cè)試
16.2.5 可用性的測(cè)試
16.2.6 測(cè)試小結(jié)
16.3 部署到生產(chǎn)環(huán)境中
16.3.1 關(guān)系數(shù)據(jù)庫(kù)的部署
16.3.2 integration services程序包的部署
16.3.3 analysis services數(shù)據(jù)庫(kù)的部署
16.3.4 reporting services報(bào)表的部署
16.3.5 master data services部署
16.4 數(shù)據(jù)倉(cāng)庫(kù)和bi文檔
16.4.1 核心描述
16.4.2 其他文檔
16.5 用戶的培訓(xùn)
16.6 用戶支持
16.7 臺(tái)式計(jì)算機(jī)的準(zhǔn)備和配置
16.8 小結(jié)
第17章 運(yùn)行與維護(hù)
17.1 提供用戶支持
17.1.1 bi門戶的維護(hù)
17.1.2 bi應(yīng)用程序的擴(kuò)展
17.2 系統(tǒng)管理
17.2.1 dw/bi系統(tǒng)的控制
17.2.2 性能的監(jiān)控
17.2.3 使用情況的監(jiān)控
17.2.4 磁盤空間的管理
17.2.5 服務(wù)和可用性的管理
17.2.6 dw/bi系統(tǒng)的性能調(diào)整
17.2.7 備份和恢復(fù)
17.2.8 etl程序包的執(zhí)行
17.3 小結(jié)
第18章 目前的需要及未來(lái)的展望
18.1 發(fā)展dw/bi系統(tǒng)
18.2 生命周期和常見(jiàn)的問(wèn)題回顧
18.2.1 階段ⅰ-- 需求、現(xiàn)實(shí)、體系結(jié)構(gòu)和設(shè)計(jì)
18.2.2 階段ⅱ-- 數(shù)據(jù)庫(kù)的開(kāi)發(fā)
18.2.3 階段ⅲ-- 開(kāi)發(fā)bi應(yīng)用程序和門戶環(huán)境
18.2.4 階段iv-- dw/bi系統(tǒng)的部署和管理
18.2.5 迭代和擴(kuò)展
18.3 microsoft bi工具集中受歡迎的部分
18.4 未來(lái)的方向:改進(jìn)的空間
18.4.1 查詢工具
18.4.2 元數(shù)據(jù)
18.4.3 關(guān)系數(shù)據(jù)庫(kù)引擎
18.4.4 analysis services
18.4.5 master data services
18.4.6 集成
18.4.7 顧客關(guān)注點(diǎn)
18.5 小結(jié)

章節(jié)摘錄

版權(quán)頁(yè):   插圖:   Albert Einstein指出了使用維度模型的主要原因:能使任何事情盡可能簡(jiǎn)單,但絕不是簡(jiǎn)化。結(jié)果證明,簡(jiǎn)單是相對(duì)的。人們普遍認(rèn)為,在數(shù)據(jù)倉(cāng)儲(chǔ)和商業(yè)智能中,維度模型是給用戶顯示信息的首選結(jié)構(gòu)。維度模型比典型的源系統(tǒng)規(guī)范化模型更便于用戶理解,即使維度模型所包含的內(nèi)容與規(guī)范化模型完全一致也是如此。維度模型中的表更少,信息分組為對(duì)用戶有意義的、一致的業(yè)務(wù)類別。這些類別稱為維度,有助于用戶瀏覽模型,因?yàn)榭梢院雎耘c特定分析無(wú)關(guān)的全部類別。 但是,盡可能簡(jiǎn)潔并不意味著模型一定簡(jiǎn)單。模型必須反映業(yè)務(wù),而業(yè)務(wù)通常都比較復(fù)雜。如果簡(jiǎn)化得過(guò)多,一般來(lái)說(shuō)只表示了聚合數(shù)據(jù),模型就會(huì)丟失對(duì)理解業(yè)務(wù)非常重要的信息。無(wú)論如何進(jìn)行數(shù)據(jù)建模,數(shù)據(jù)內(nèi)容內(nèi)在的復(fù)雜性都使大多數(shù)人最終愿意通過(guò)結(jié)構(gòu)化報(bào)表和分析應(yīng)用程序來(lái)訪問(wèn)DW/BI系統(tǒng)。 要達(dá)到第二個(gè)目標(biāo),即良好的性能,可能更需要依賴平臺(tái)。在關(guān)系環(huán)境下,維度模型能提供更好的查詢性能,這是因?yàn)樵趧?chuàng)建維度時(shí)采用了反規(guī)范化的方法。通過(guò)預(yù)先連接各種層次結(jié)構(gòu)和查詢表,優(yōu)化程序考慮的連接路徑較少,創(chuàng)建的中間臨時(shí)表也更少。通過(guò)采用維度結(jié)構(gòu)而不是完全規(guī)范化的結(jié)構(gòu),SQL Server關(guān)系數(shù)據(jù)庫(kù)的分析查詢性能會(huì)更好——通常會(huì)好得多。從更基本的層面上看,優(yōu)化程序可以識(shí)別出維度模型,并利用其結(jié)構(gòu)大幅度減少返回的行數(shù)。這稱為“星型連接優(yōu)化”,當(dāng)然這也是企業(yè)版的功能。 在Analysis Service OLAP環(huán)境下,專門把引擎設(shè)計(jì)成支持維度模型,主要通過(guò)在維度之內(nèi)和之間進(jìn)行預(yù)聚合來(lái)提高性能。 達(dá)到第三個(gè)目標(biāo)需要采用各種設(shè)計(jì)模式,以創(chuàng)建出精確捕獲和跟蹤業(yè)務(wù)的模型。下面從最基本的模式開(kāi)始。維度模型由一個(gè)或者多個(gè)中心事實(shí)表和與其相關(guān)的維度構(gòu)成。事實(shí)表位于中心,而維度環(huán)繞在其周圍,類似于星型結(jié)構(gòu),因此又把維度模型稱為星型模式。為避免混淆,本書始終使用維度模型這一術(shù)語(yǔ)。 從關(guān)系數(shù)據(jù)建模的角度來(lái)看,維度模型是由一個(gè)規(guī)范化的事實(shí)表和反規(guī)范化的一些維度表組成的。本節(jié)將定義維度模型、事實(shí)表和維度等基本組成部分,以及在處理隨時(shí)間而發(fā)生的改動(dòng)時(shí)涉及的一些重要概念。 2.1.1 事實(shí)表 每個(gè)事實(shí)表都包含與特定業(yè)務(wù)過(guò)程相關(guān)的度量,例如下一個(gè)訂單,顯示一個(gè)網(wǎng)頁(yè),接待一位患者或者處理一個(gè)顧客的服務(wù)請(qǐng)求。事實(shí)表中的一條記錄是一個(gè)度量事件,這些事件通常有數(shù)字值,用來(lái)量化大量的事件,如訂購(gòu)的數(shù)量、銷量或呼叫持續(xù)時(shí)間等。這些數(shù)字稱為事實(shí)(或在Analysis Services中稱為度量)。 事實(shí)表的鍵通常是多部分的鍵,由業(yè)務(wù)事件涉及的每個(gè)維度表的外鍵子集構(gòu)成。 1.事實(shí) 大多數(shù)事實(shí)都是數(shù)字型的,且可以累加(如總銷量或單位銷量),這意味著可以對(duì)所有維度求和??杉有院苤匾?,因?yàn)镈W/BI應(yīng)用程序很少檢索單個(gè)事實(shí)表記錄。用戶查詢一般一次選擇數(shù)百或數(shù)千條記錄并合計(jì)。查詢?nèi)ツ昝總€(gè)月的銷售量?jī)H返回12行結(jié)果,但它合計(jì)了成千上萬(wàn)行(或者更多)。一些事實(shí)具有半可加性(如市場(chǎng)份額或賬目結(jié)算),一些事實(shí)則具有非可加性(如單價(jià)等)。 并非所有的數(shù)字型數(shù)據(jù)都是事實(shí),包括離散的描述信息,例如用來(lái)描述產(chǎn)品的包裝尺寸或重量,以及用來(lái)描述商店面積的平方英尺。通常這些不大變化的數(shù)字值是維度表中的描述性屬性。這種描述信息自然也用來(lái)約束查詢,而不是在計(jì)算中求和。決定將一個(gè)數(shù)據(jù)元素作為維度或事實(shí)的一部分時(shí),這一區(qū)別是非常有用的。 一些業(yè)務(wù)過(guò)程跟蹤沒(méi)有任何實(shí)際度量的事件。如果發(fā)生這種事件,源系統(tǒng)就添加一項(xiàng),反之源系統(tǒng)就沒(méi)有任何記錄。這類事件的常見(jiàn)示例有雇傭活動(dòng),例如聘用或者解雇某個(gè)雇員;參與事件的人數(shù),例如學(xué)生何時(shí)加入某個(gè)班級(jí)等。跟蹤這類事件的事實(shí)表沒(méi)有任何實(shí)際度量值,因此也稱為沒(méi)有事實(shí)的事實(shí)表。通常的做法是向表中添加一列,該列稱為EventCount,并且包含數(shù)字1。這就為用戶提供了一種統(tǒng)計(jì)事件數(shù)量的簡(jiǎn)便方法,即通過(guò)累加EventCount事實(shí)來(lái)實(shí)現(xiàn)。 有些事實(shí)是從其他事實(shí)派生或計(jì)算得到的,如純收入是從銷售總額減去營(yíng)業(yè)稅后得到的。一些半可加性的事實(shí)可以使用基于查詢上下文的派生列來(lái)處理,例如月底結(jié)算是累加多個(gè)賬戶,而不是對(duì)日期進(jìn)行累加。對(duì)于非可加性的單價(jià),可以把它定義為平均單價(jià),即Total Amount(總額)除以Total Quantity(總數(shù)量)。有幾種方法可以處理這種派生或計(jì)算得到的事實(shí)。可以把它們作為ETL過(guò)程的一部分計(jì)算,并在事實(shí)表中存儲(chǔ):也可以把它們存儲(chǔ)在事實(shí)表的視圖定義里;還可以把它們包含在Analysis Services數(shù)據(jù)庫(kù)的定義中。唯一不能接受的方式是把這一過(guò)程留給用戶處理。

編輯推薦

《Microsoft數(shù)據(jù)倉(cāng)庫(kù)工具箱(第2版):使用SQL Server 2008 R2和Microsoft BI工具集》描述如何使用Microsoft SQL Server產(chǎn)品集設(shè)計(jì)并構(gòu)建一個(gè)成功的商業(yè)智能系統(tǒng)及其底層的數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)庫(kù)。

圖書封面

圖書標(biāo)簽Tags

無(wú)

評(píng)論、評(píng)分、閱讀與下載


    Microsoft數(shù)據(jù)倉(cāng)庫(kù)工具箱 PDF格式下載


用戶評(píng)論 (總計(jì)24條)

 
 

  •   大數(shù)據(jù)是今后的社會(huì)發(fā)展方向,這本書還是有點(diǎn)用滴。
  •   第一次在網(wǎng)上購(gòu)買書籍。既省時(shí)又省力更省財(cái)。比實(shí)體店實(shí)惠多了。還看上兩本,但是可惜不在本次活動(dòng)促銷只能,可能是書太好了。再湊機(jī)會(huì)吧。
  •   書很不錯(cuò),印刷很好,對(duì)工作很有幫助。
  •   發(fā)貨很快,昨晚下的單子,今天中午就收到了,贊一個(gè)!書的質(zhì)量還好,內(nèi)容寫得也不錯(cuò)
  •   發(fā)貨很快,沒(méi)有磨損
  •   還可以,實(shí)踐性不強(qiáng)
  •   比較喜歡這個(gè)系列的書,講得很透徹,有一些實(shí)用的案例。一直覺(jué)得老外寫的書比較詳細(xì),既可以學(xué)習(xí),又可以當(dāng)工具書使用
  •   很適合有工作經(jīng)驗(yàn)人
  •   書很好,謝謝,物流慢投訴到當(dāng)當(dāng)網(wǎng),沒(méi)人給我任何回復(fù),讓我很失望,雖然我會(huì)繼續(xù)從當(dāng)當(dāng)買書,但是但凡有其他選擇我一定不會(huì)再選擇當(dāng)當(dāng)。
  •   內(nèi)容比較偏重流程和理論方面,具體操作/技術(shù)技巧相對(duì)比較少。
  •   紙質(zhì)差,表面被畫了一下,有些地方印刷不好
  •   概念性書籍,不實(shí)用,也可能自己級(jí)別不夠。
  •   還沒(méi)自己看,紙質(zhì)還不錯(cuò)是正版
  •   買書之前看了目錄感覺(jué)不錯(cuò),看了書很失望,內(nèi)容很多,太過(guò)簡(jiǎn)單,對(duì)于程序員來(lái)說(shuō),不實(shí)用
  •   我是沖著書的內(nèi)容買的,包裝的袋子都爛了, 物流大叔送的貨,我看別的包裝都是好好的,我的都爛了好幾個(gè)地方,這本書的書角都碰壞了,心疼死了!給他反映也不理,抽了單子就走。怕麻煩,就沒(méi)有進(jìn)行更換。買了5本書,建議當(dāng)當(dāng)下次給弄個(gè)小紙箱包裝下。
  •   就是一本騙錢的書,每個(gè)章節(jié)簡(jiǎn)直就是簡(jiǎn)單的概括,說(shuō)的沒(méi)有實(shí)質(zhì)性的內(nèi)容,不但沒(méi)有具體的事例,連最基本的操作過(guò)程都沒(méi)有,然后每個(gè)章節(jié)都給你一些來(lái)自于kimboll……或者M(jìn)SDN上面的引用鏈接,全都是英文的,還特么不如自己百度算了!都是垃圾!這種書我能出100本,就是東拼西湊的碼字,然后告訴你,請(qǐng)baidu知識(shí)文章,搜索關(guān)鍵字“BI”,就是這個(gè)意思。
  •   雖然作者很大牛,不過(guò)這本書很一般,涉及的知識(shí)面雖然很廣,但都是蜻蜓點(diǎn)水的一帶而過(guò)比如里面介紹SSIS,看完之后依然不知所云,因?yàn)樘珴饪s了,很難懂如果不是之前看過(guò)一些SSAS的書,對(duì)這個(gè)里面的相關(guān)章節(jié)肯定也看的云里霧里不過(guò)有點(diǎn)好的是,它把整個(gè)BI的流程,部署都講的還行,屬于提綱挈領(lǐng)型的著作吧,在你對(duì)這些知識(shí)面都懂了后,看一遍有助于提升一個(gè)level,但如果是新手想入門,不建議先看這本書。
  •   內(nèi)容不錯(cuò),就是有些術(shù)語(yǔ)不明白,
  •   以為技術(shù)大牛推薦我買的書。但是我要說(shuō),翻譯的太差勁
  •   買來(lái)是當(dāng)做我們的教學(xué)用書,不過(guò)很不錯(cuò),寫的很好!數(shù)據(jù)倉(cāng)庫(kù)嘛,未來(lái)BI大趨勢(shì)下,學(xué)好還是不錯(cuò)的,這是一本好書哦
  •   容易閱讀,價(jià)格便宜
  •   計(jì)算機(jī)圖書更新太快了
  •   感覺(jué)很不錯(cuò)的哦?!?/li>
  •   相當(dāng)好的一本書,容易實(shí)踐,值得推薦!
 

250萬(wàn)本中文圖書簡(jiǎn)介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書網(wǎng) 手機(jī)版

京ICP備13047387號(hào)-7