出版時(shí)間:2011-9 出版社:浙江大學(xué)出版社 作者:蔡穎,鮑立威 頁(yè)數(shù):301
內(nèi)容概要
商業(yè)智能是將企事業(yè)單位積累的數(shù)據(jù)轉(zhuǎn)化為知識(shí),幫助企事業(yè)單位做出科學(xué)決策的工具。蔡穎、鮑立威編著的《商業(yè)智能原理與應(yīng)用》以“
商業(yè)智能”應(yīng)用為主線,全面系統(tǒng)地介紹了商業(yè)智能的基本概念、方法和技術(shù),克服了以“數(shù)據(jù)挖掘” 技術(shù)為豐線的局限性,并以MS SQL
Server作為數(shù)據(jù)倉(cāng)庫(kù)管理平臺(tái),以SQL Server Business Intelligence Developrnent
Visual
Studio作為商業(yè)智能開發(fā)平臺(tái),進(jìn)行了豐富的案例演示。《商業(yè)智能原理與應(yīng)用》可作為高等院校高年級(jí)本科生教材,也可作為MBA教材以及盯相關(guān)專業(yè)人員、市場(chǎng)營(yíng)銷人員、管理決策支持等實(shí)際經(jīng)濟(jì)管理領(lǐng)域?qū)崉?wù)工作者的參考用書。
書籍目錄
第1章 數(shù)據(jù)挖掘和商業(yè)智能
1.1 數(shù)據(jù)挖掘的興起
1.1.1 數(shù)據(jù)豐富與知識(shí)匱乏
1.1.2 從數(shù)據(jù)到知識(shí)
1.1.3 數(shù)據(jù)挖掘產(chǎn)生
1.1.4 數(shù)據(jù)挖掘解決的商業(yè)問(wèn)題
1.2 什么是商業(yè)智能
1.2.1 企業(yè)決策實(shí)現(xiàn)過(guò)程的信息需求
1.2.2 企業(yè)信息化系統(tǒng)中的商業(yè)智能
1.2.3 商業(yè)智能的體系結(jié)構(gòu)
1.3 數(shù)據(jù)挖掘和商業(yè)智能工具
1.3.1 商業(yè)智能工具的選擇
1.3.2 SQL Server 2008的商業(yè)智能構(gòu)架
1.4 數(shù)據(jù)挖掘應(yīng)用案例
【本章小結(jié)】
【練習(xí)題】
第2章 數(shù)據(jù)倉(cāng)庫(kù)
2.1 數(shù)據(jù)倉(cāng)庫(kù)的概念
2.1.1 從傳統(tǒng)數(shù)據(jù)庫(kù)到數(shù)據(jù)倉(cāng)庫(kù)
2.1.2 數(shù)據(jù)倉(cāng)庫(kù)的定義與基本特性
2.2 數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu)
2.2.1 數(shù)據(jù)倉(cāng)庫(kù)的物理結(jié)構(gòu)
2.2.2 數(shù)據(jù)倉(cāng)庫(kù)的系統(tǒng)結(jié)構(gòu)
2.2.3 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)模型
2.3 元數(shù)據(jù)
2.3.1 元數(shù)據(jù)的定義
2.3.2 元數(shù)據(jù)的分類及作用
2.4 數(shù)據(jù)集市
2.4.1 兩種數(shù)據(jù)集市結(jié)構(gòu)
2.4.2 數(shù)據(jù)集市與數(shù)據(jù)倉(cāng)庫(kù)的差別
2.4.3 關(guān)于數(shù)據(jù)集市的誤區(qū)
2.5 數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)與實(shí)施
2.5.1 自上而下還是自下而上的設(shè)計(jì)方法
2.5.2 數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)步驟
2.5.3 數(shù)據(jù)倉(cāng)庫(kù)的實(shí)施
2.5.4 數(shù)據(jù)倉(cāng)庫(kù)的使用和維護(hù)
2.6 Microsoft數(shù)據(jù)倉(cāng)庫(kù)(DW)和商業(yè)智能(BI)工具
2.7 數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)案例
2.7.1 業(yè)務(wù)數(shù)據(jù)庫(kù)AdventureWorks
2.7.2 業(yè)務(wù)數(shù)據(jù)分析
2.7.3 項(xiàng)目需求分析
2.7.4 構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)
【本章小結(jié)】
【練習(xí)題】
第3章 數(shù)據(jù)預(yù)處理
3.1 數(shù)據(jù)預(yù)處理的重要性
3.2 數(shù)據(jù)清洗
3.2.1 遺漏數(shù)據(jù)處理
3.2.2 噪聲數(shù)據(jù)處理
3.2.3 不一致數(shù)據(jù)處理
3.3 數(shù)據(jù)集成與轉(zhuǎn)換
3.3.1 數(shù)據(jù)集成處理
3.3.2 數(shù)據(jù)轉(zhuǎn)換處理
3.4 數(shù)據(jù)消減
3.4.1 數(shù)據(jù)立方合計(jì)
3.4.2 維數(shù)消減
3.4.3 數(shù)據(jù)塊消減
3.5 離散化和概念層次樹生成
3.5.1 數(shù)值概念層次樹生成
3.5.2 類別概念層次樹生成
3.6 使用SSIS對(duì)數(shù)據(jù)進(jìn)行ETL操作
3.6.1 SSIS的主要功能
3.6.2 SSIS的體系結(jié)構(gòu)
3.6.3 SSIS包主要對(duì)象
3.6.4 創(chuàng)建并運(yùn)行一個(gè)簡(jiǎn)單的包
【本章小結(jié)】
【思考題】
第4章 多維數(shù)據(jù)分析
4.1 多維數(shù)據(jù)分析基礎(chǔ)
4.2 多維數(shù)據(jù)分析方法
4.3 多維數(shù)據(jù)的存儲(chǔ)方式
4.3.1 三種存儲(chǔ)方式
4.3.2 三種存儲(chǔ)方式的比較
4.4 多維表達(dá)式(MDX)
4.4.1 MDX中的重要概念
4.4.2 MDX基本語(yǔ)法
4.4.3 MDX與SQL的區(qū)別
4.4.4 MDX核心函數(shù)
4.5 使用SQL Servet Analysis Services(SSAS)構(gòu)建維度和多維數(shù)據(jù)集
4.5.1 SSAS的體系結(jié)構(gòu)
4.5.2 SSAS的統(tǒng)一維度模型(UDM)
4.5.3 SSAS示例
4.6 使用Excel數(shù)據(jù)透視圖瀏覽多維數(shù)據(jù)集
【本章小結(jié)】
【思考題】
第5章 用Microsoft SSRS處理智能報(bào)表
5.1 SSRS商業(yè)智能報(bào)表
5.1.1 商業(yè)智能報(bào)表與商業(yè)智能
5.1.2 SSRS的結(jié)構(gòu)
5.1.3 SSRS報(bào)表的3種狀態(tài)
5.2 使用SSRS創(chuàng)建報(bào)表
5.2.1 創(chuàng)建一個(gè)簡(jiǎn)單報(bào)表項(xiàng)目
5.2.2 增強(qiáng)基本報(bào)表的功能
5.2.3 發(fā)布報(bào)表
【本章小結(jié)】
第6章 數(shù)據(jù)挖掘技術(shù)
6.1 數(shù)據(jù)挖掘的任務(wù)
6.1.1 分類
6.1.2 回歸
6.1.3 時(shí)間序列分析
6.1.4 預(yù)測(cè)
6.1.5 聚類
6.1.6 關(guān)聯(lián)規(guī)則
6.1.7 序列分析
6.1.8 偏差檢測(cè)
6.2 數(shù)據(jù)挖掘的對(duì)象
6.3 數(shù)據(jù)挖掘系統(tǒng)的分類
6.4 數(shù)據(jù)挖掘項(xiàng)目的生命周期
6.4.1 商業(yè)理解
6.4.2 數(shù)據(jù)準(zhǔn)備
6.4.3 模型構(gòu)建
6.4.4 模型評(píng)估
6.4.5 應(yīng)用集成和實(shí)施
6.5 數(shù)據(jù)挖掘面臨的挑戰(zhàn)及發(fā)展
6.5.1 數(shù)據(jù)挖掘面臨的挑戰(zhàn)
6.S.2 數(shù)據(jù)挖掘的發(fā)展趨勢(shì)
【本章小結(jié)】
【思考題】
第7章 關(guān)聯(lián)挖掘
7.1 關(guān)聯(lián)規(guī)則挖掘
7.1.1 購(gòu)物分析:關(guān)聯(lián)挖掘
7.1.2 基本概念
7.1.3 關(guān)聯(lián)規(guī)則挖掘分類
7.2 單維布爾關(guān)聯(lián)規(guī)則挖掘
7.2.1 Apriori算法
7.2.2 關(guān)聯(lián)規(guī)則的生成
7.3 挖掘多層級(jí)關(guān)聯(lián)規(guī)則
7.3.1 挖掘多層次關(guān)聯(lián)規(guī)則
7.3.2 挖掘多層次關(guān)聯(lián)規(guī)則方法
7.3.3 多層次關(guān)聯(lián)規(guī)則的冗余
7.4 多維關(guān)聯(lián)規(guī)則的挖掘
7.4.1 多維關(guān)聯(lián)規(guī)則
7.4.2 利用靜態(tài)離散挖掘多維關(guān)聯(lián)規(guī)則
7.5 關(guān)聯(lián)挖掘中的相關(guān)分析
7.5.1 無(wú)意義強(qiáng)關(guān)聯(lián)規(guī)則示例
7.5.2 從關(guān)聯(lián)分析到相關(guān)分析
7.6 利用Microsoft SSAS進(jìn)行關(guān)聯(lián)挖掘
7.6.1 Microsoft關(guān)聯(lián)規(guī)則模型簡(jiǎn)介
7.6.2 關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘示例
【本章小結(jié)】
【思考題】
第8章 分類與預(yù)測(cè)
8.1 分類與預(yù)測(cè)基本知識(shí)
8.2 有關(guān)分類和預(yù)測(cè)的幾個(gè)問(wèn)題
8.3 基于決策樹的分類
8.3.1 決策樹生成算法
8.3.2 屬性選擇方法
8.3.3 樹枝修剪
8.3.4 決策樹分類規(guī)則獲取
8.3.5 級(jí)別決策樹方法的改進(jìn)
8.3.6 數(shù)據(jù)倉(cāng)庫(kù)技術(shù)與決策樹歸納的結(jié)合
8.4 貝葉斯分類方法
8.4.1 貝葉斯定理
8.4.2 基本貝葉斯分類方法
8.5 神經(jīng)網(wǎng)絡(luò)分類方法
8.5.1 多層前饋神經(jīng)網(wǎng)絡(luò)
8.5.2 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
8.5.3 后傳方法
8.5.4 后傳方法和可理解性
8.6 分類器準(zhǔn)確性
8.6.1 分類器準(zhǔn)確性估計(jì)
8.7 預(yù)測(cè)方法
8.7.1 線性與多變量回歸
8.7.2 非線性回歸
8.7.3 其它回歸模型
8.8 Microsoft貝葉斯算法
8.8.1 貝葉斯算法的參數(shù)
8.8.2 使用貝葉斯模型
8.8.3 瀏覽貝葉斯模型
8.9. Microsoft決策樹算法
8.10 Microsoft神經(jīng)網(wǎng)絡(luò)算法
【本章小結(jié)】
【思考題】
第9章 聚類分析
9.1 聚類分析概念
9.2 聚類分析中的數(shù)據(jù)類型
9.2.1 間隔數(shù)值屬性
9.2.2 二值屬性
9.2.3 符號(hào)、順序和比例數(shù)值屬性
9.2.4 混合類型屬性
9.3 主要聚類方法
9.4 劃分方法
9.4.1 傳統(tǒng)劃分方法
9.4.2 大數(shù)據(jù)庫(kù)的劃分方法
9.5 層次方法
9.5.1 兩種基本層次聚類方法
9.6 基于密度方法
9.6.1 基于密度方法:DBSCAN
9.7 異常數(shù)據(jù)分析
9.7.1 基于統(tǒng)計(jì)的異常檢測(cè)方法
9.7.2 基于距離的異常檢測(cè)方法
9.7.3 基于偏差的異常檢查方法
9.8 Microsoft聚類算法
【本章小結(jié)】
【思考題】
第10章 時(shí)序數(shù)據(jù)和序列數(shù)據(jù)挖掘
10.1 時(shí)間序列模型
10.2 Microsoft的時(shí)序算法
10.2.1 自動(dòng)回歸
10.2.2 自動(dòng)回歸樹
10.2.3 數(shù)據(jù)中的季節(jié)性處理
10.2.4 使用預(yù)測(cè)函數(shù)預(yù)測(cè)值
10.3 Microsoft時(shí)序算法示例
10.4 Microsoft的序列模式挖掘
10.4.1 Microsoft序列聚類算法
10.4.2 序列聚類挖掘示例
【本章小結(jié)】
【思考題】
第11章 基于多維數(shù)據(jù)集的數(shù)據(jù)挖掘
11.1 OLAP和數(shù)據(jù)挖掘之間的關(guān)系
11.2 構(gòu)建OLAP挖掘模型
【本章小結(jié)】
章節(jié)摘錄
版權(quán)頁(yè):插圖:最初的階段集中在理解項(xiàng)目目標(biāo)和從業(yè)務(wù)的角度理解需求,同時(shí)將這個(gè)知識(shí)轉(zhuǎn)化為數(shù)據(jù)挖掘問(wèn)題的定義和完成目標(biāo)的初步計(jì)劃。商業(yè)理解階段所包含的一般性任務(wù)如下:·確定業(yè)務(wù)目標(biāo):數(shù)據(jù)挖掘項(xiàng)目小組中分析人員的首要任務(wù)就是要從業(yè)務(wù)的角度全面地理解客戶的正真意圖和需求。只有對(duì)業(yè)務(wù)目標(biāo)有一個(gè)清晰明確的定義,即決定到底想干什么,才能充分發(fā)揮數(shù)據(jù)挖掘的價(jià)值。這一步產(chǎn)生的輸出有:?jiǎn)栴}背景、業(yè)務(wù)目標(biāo)、業(yè)務(wù)成功標(biāo)準(zhǔn)。·評(píng)估環(huán)境:評(píng)估環(huán)境是對(duì)所有的資源、約束、假設(shè)和其他應(yīng)考慮的因素進(jìn)行更加詳細(xì)的分析和評(píng)估,以便下一步確定數(shù)據(jù)分析目標(biāo)和項(xiàng)目計(jì)劃。這一步將產(chǎn)生的輸出有:資源清單、需求,假設(shè)和約束、風(fēng)險(xiǎn)和所有費(fèi)用、術(shù)語(yǔ)表、成本和收益?!ご_定數(shù)據(jù)挖掘目標(biāo):與業(yè)務(wù)目標(biāo)不同,數(shù)據(jù)挖掘目標(biāo)是從技術(shù)的角度描述項(xiàng)目的目的。因此,需要把業(yè)務(wù)領(lǐng)域的目標(biāo)投影到數(shù)據(jù)挖掘領(lǐng)域,得到相應(yīng)的數(shù)據(jù)挖掘目標(biāo)。這一步產(chǎn)生的輸出有:數(shù)據(jù)挖掘目標(biāo)、數(shù)據(jù)挖掘成功標(biāo)準(zhǔn)。·產(chǎn)生項(xiàng)目計(jì)劃:該階段的主要任務(wù)是描述如何完成數(shù)據(jù)挖掘目標(biāo),制定達(dá)到業(yè)務(wù)目標(biāo)的計(jì)劃。計(jì)劃中需要列出項(xiàng)目將要執(zhí)行的階段,以及每個(gè)階段的詳細(xì)計(jì)劃(包括每個(gè)階段的試卷、所需資源、輸入、輸出和依賴)。這一步產(chǎn)生的輸出有:項(xiàng)目計(jì)劃、工具和技術(shù)的初步評(píng)價(jià)。6.4.2數(shù)據(jù)準(zhǔn)備數(shù)據(jù)準(zhǔn)備階段從初始的收集數(shù)據(jù)、了解數(shù)據(jù)、清理數(shù)據(jù)到構(gòu)造最終數(shù)據(jù)集的所有活動(dòng)。這些數(shù)據(jù)將是模型工具的輸入值。大致可包括以下一些內(nèi)容:·收集原始數(shù)據(jù):商業(yè)數(shù)據(jù)往往存儲(chǔ)在企業(yè)的許多系統(tǒng)中。首先要把相關(guān)的數(shù)據(jù)放到一個(gè)數(shù)據(jù)庫(kù)或者數(shù)據(jù)集市,如果是從多個(gè)數(shù)據(jù)源獲取數(shù)據(jù),那么還需要考慮數(shù)據(jù)集成工作。這一步產(chǎn)生的輸出有:原始數(shù)據(jù)收集報(bào)告,里面包括負(fù)責(zé)維護(hù)此數(shù)據(jù)的人/組織、費(fèi)用(有些數(shù)據(jù)可能需要購(gòu)買)、存儲(chǔ)方式、安全需求,使用限制等?!?shù)據(jù)清理和轉(zhuǎn)換:數(shù)據(jù)清理的目的是除去數(shù)據(jù)集中的“噪聲”和不相關(guān)的信息。數(shù)據(jù)轉(zhuǎn)換的目的則是將數(shù)據(jù)的數(shù)據(jù)類型與值轉(zhuǎn)換為統(tǒng)一的格式。這一步輸出格式化的數(shù)據(jù)。
編輯推薦
《商業(yè)智能原理與應(yīng)用》全面系統(tǒng)地介紹了商業(yè)智能的基本概念、基本方法和基本技術(shù),并以MicrosoftSQL Server作為數(shù)據(jù)倉(cāng)庫(kù)管理平臺(tái),以SQL Server Business Intelligence Development Visual Studio作為商業(yè)智能開發(fā)平臺(tái),進(jìn)行了豐富的案例演示?!渡虡I(yè)智能原理與應(yīng)用》共分11章,第1章介紹了數(shù)據(jù)挖掘的發(fā)展過(guò)程和商業(yè)智能的定義;第2章講解了數(shù)據(jù)倉(cāng)庫(kù)的概念、體系結(jié)構(gòu)和設(shè)計(jì)與實(shí)施;第3章講解了數(shù)據(jù)預(yù)處理的主要方法及如何使用SQL Server Integration Services進(jìn)行數(shù)據(jù)的清理、轉(zhuǎn)換和裝載;第4章主要講解了多維數(shù)據(jù)分析的方法和如何使用SQL Server Analysis Services構(gòu)建多維數(shù)據(jù)集;第5章主要講解了如何使用SQL Server Report Services構(gòu)建智能報(bào)表;第6章至第10章主要講解了數(shù)據(jù)挖掘技術(shù)和主要的數(shù)據(jù)挖掘算法,并使用SQL Server中的數(shù)據(jù)挖掘算法對(duì)挖掘過(guò)程作了詳細(xì)的描述;第11章主要介紹基于多維數(shù)據(jù)集的數(shù)據(jù)挖掘及相關(guān)案例。
圖書封面
評(píng)論、評(píng)分、閱讀與下載