數(shù)據(jù)倉庫與數(shù)據(jù)挖掘原理及應(yīng)用

出版時(shí)間:2009-9  出版社:科學(xué)出版社  作者:王麗珍 等編著  頁數(shù):296  
Tag標(biāo)簽:無  

前言

  進(jìn)入信息社會(huì)以來,信息技術(shù)經(jīng)歷了從計(jì)算機(jī)主機(jī)的信息集中處理方式到個(gè)人計(jì)算機(jī)(PC)的信息分布處理形式的轉(zhuǎn)變;從單一的計(jì)算機(jī)操作系統(tǒng)到計(jì)算機(jī)互聯(lián)網(wǎng)絡(luò)操作的改變:從客戶機(jī)/服務(wù)器(Client/Server)計(jì)算體系到多層體系結(jié)構(gòu)計(jì)算模式的轉(zhuǎn)變;從單一數(shù)據(jù)庫到大型數(shù)據(jù)倉庫和從局域網(wǎng)到Internet全球網(wǎng)的改變。現(xiàn)代信息技術(shù)的發(fā)展和現(xiàn)代科學(xué)技術(shù)的進(jìn)步,使人類邁入新的時(shí)期——信息化時(shí)代?! ⌒畔⑻幚砑夹g(shù)的發(fā)展使得各類數(shù)據(jù)、信息急劇增長,給數(shù)據(jù)的傳輸、存儲(chǔ)帶來了許多新的問題,特別是由于各類不同事務(wù)產(chǎn)生大量不同類型的數(shù)據(jù),這些數(shù)據(jù)分別被許多各個(gè)時(shí)期建立的應(yīng)用系統(tǒng)所使用。人們希望能夠看到所有數(shù)據(jù)和信息的綜合情況,而這些數(shù)據(jù)和信息有許多不能被統(tǒng)一描述,不能被現(xiàn)有應(yīng)用系統(tǒng)綜合使用。針對(duì)這一問題,人們?cè)O(shè)想專門為業(yè)務(wù)的統(tǒng)計(jì)分析建立一個(gè)數(shù)據(jù)中心,它的數(shù)據(jù)來自聯(lián)機(jī)的事務(wù)處理系統(tǒng)、異構(gòu)的外部數(shù)據(jù)源、脫機(jī)的歷史業(yè)務(wù)數(shù)據(jù)等,這個(gè)數(shù)據(jù)中心就是數(shù)據(jù)倉庫。數(shù)據(jù)倉庫技術(shù)的應(yīng)運(yùn)而生,成為信息技術(shù)領(lǐng)域非常熱門的話題之一?! ?shù)據(jù)倉庫技術(shù)的提出建立了一種體系化的數(shù)據(jù)存儲(chǔ)環(huán)境,將分析決策所需要的大量數(shù)據(jù)從傳統(tǒng)的操作環(huán)境中分離出來,使分散、不一致的操作數(shù)據(jù)轉(zhuǎn)換成集成、統(tǒng)一的信息。企業(yè)內(nèi)不同單位、不同角色的成員都可以在此單一的環(huán)境之下,通過運(yùn)用其中的數(shù)據(jù)與信息,發(fā)現(xiàn)全新的視野和新的問題,產(chǎn)生用于決策的新分析方法。作為決策支持系統(tǒng)的重要組成部分,數(shù)據(jù)倉庫為決策支持系統(tǒng)提供了分析決策所需的數(shù)據(jù):OLAP的產(chǎn)生,則進(jìn)一步增強(qiáng)了決策支持系統(tǒng)快速、一致和交互性的分析能力,它利用存儲(chǔ)在數(shù)據(jù)倉庫中的數(shù)據(jù)完成各種分析操作,并以直觀易懂的形式將分析結(jié)果展現(xiàn)給決策分析人員;而數(shù)據(jù)挖掘是從大量數(shù)據(jù)中提取或“挖掘”知識(shí),從而實(shí)現(xiàn)從“數(shù)據(jù)一信息一知識(shí)”的過程,為企業(yè)的管理階層提供各種層次的決策支持。

內(nèi)容概要

本書全面深入地介紹了數(shù)據(jù)倉庫、聯(lián)機(jī)分析處理和數(shù)據(jù)挖掘的基本概念、基本方法和應(yīng)用技術(shù)。全書分成三篇:數(shù)據(jù)倉庫與OLAP篇的主要內(nèi)容包括:數(shù)據(jù)倉庫的基本概念、體系結(jié)構(gòu)、模型設(shè)計(jì)、開發(fā)方法、ETL、元數(shù)據(jù)和數(shù)據(jù)集市,OLAP的基本概念、基本操作、數(shù)據(jù)模型和OLAP的實(shí)現(xiàn)及準(zhǔn)則;數(shù)據(jù)挖掘與空間數(shù)據(jù)挖掘篇的主要內(nèi)容包括關(guān)聯(lián)分析方法、聚類分析技術(shù)、分類與預(yù)測(cè)方法、異常檢測(cè)算法以及空間數(shù)據(jù)挖掘技術(shù)等;工具與實(shí)例篇介紹了數(shù)據(jù)挖掘工具及可視化、Cognos公司的BI主要產(chǎn)品和企業(yè)數(shù)據(jù)倉庫系統(tǒng)構(gòu)建。    本書可作為高等院校計(jì)算機(jī)軟件與應(yīng)用、信息科學(xué)等專業(yè)的學(xué)生學(xué)習(xí)數(shù)據(jù)倉庫、OLAP及數(shù)據(jù)挖掘技術(shù)的實(shí)用教程或參考書,也可供從事數(shù)據(jù)倉庫、數(shù)據(jù)挖掘研究、設(shè)計(jì)、開發(fā)等工作的科研、工程人員參考。

書籍目錄

第一篇 數(shù)據(jù)倉庫與OLAP 第1章 數(shù)據(jù)倉庫基本概念    1.1  從數(shù)據(jù)庫到數(shù)據(jù)倉庫     1.1.1 蜘蛛網(wǎng)問題     1.1.2 事務(wù)處理和分析處理數(shù)據(jù)環(huán)境的分離    1.2 什么是數(shù)據(jù)倉庫     1.2.1 面向主題     1.2.2 集成     1.2.3 穩(wěn)定性     1.2.4 隨時(shí)間而變化    1.3 數(shù)據(jù)倉庫與傳統(tǒng)數(shù)據(jù)庫的比較     1.3.1 兩個(gè)系統(tǒng)的主要區(qū)別     1.3.2 兩個(gè)系統(tǒng)的查詢支持不同     1.3.3 兩個(gè)系統(tǒng)數(shù)據(jù)組織模式示例比較    1.4 數(shù)據(jù)倉庫的系統(tǒng)結(jié)構(gòu)     1.4.1 三層數(shù)據(jù)倉庫結(jié)構(gòu)     1.4.2 數(shù)據(jù)倉庫中的關(guān)鍵名詞    1.5 數(shù)據(jù)倉庫的數(shù)據(jù)組織     1.5.1 數(shù)據(jù)倉庫的數(shù)據(jù)組織結(jié)構(gòu)     1.5.2 數(shù)據(jù)粒度與數(shù)據(jù)分割     1.5.3 數(shù)據(jù)倉庫的數(shù)據(jù)組織形式     1.5.4 數(shù)據(jù)倉庫的數(shù)據(jù)追加和清理    1.6  小結(jié)    習(xí)題 第2章 數(shù)據(jù)倉庫中的ETL和元數(shù)據(jù)    2.1  ETL     2.1.1  ETL概念     2.1.2  ETL作用     2.1.3  ETL工具   2.2 元數(shù)據(jù)     2.2.1 什么是元數(shù)據(jù)     2.2.2 元數(shù)據(jù)的標(biāo)準(zhǔn)化     2.2.3 數(shù)據(jù)倉庫中的元數(shù)據(jù)管理     2.2.4 在數(shù)據(jù)倉庫項(xiàng)目中使用元數(shù)據(jù)的建議   2.3 外部數(shù)據(jù)     2.3.1 外部數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)     2.3.2 元數(shù)據(jù)和外部數(shù)據(jù)     2.3.3 外部數(shù)據(jù)的存儲(chǔ)     2.3.4 外部數(shù)據(jù)的管理    2.4  小結(jié)    習(xí)題 第3章 數(shù)據(jù)倉庫模型設(shè)計(jì)及數(shù)據(jù)倉庫建立    3.1 數(shù)據(jù)倉庫的概念模型設(shè)計(jì)     3.1.1 E.R模型     3.1.2 面向?qū)ο蟮姆治龇椒ā? 3.2 數(shù)據(jù)倉庫的邏輯模型設(shè)計(jì)     3.2.1 分析主題,確定當(dāng)前要裝載的主題     3.2.2 確定數(shù)據(jù)粒度的選擇     3.2.3 確定數(shù)據(jù)分割策略     3.2.4 增加導(dǎo)出字段     3.2.5 定義關(guān)系模式     3.2.6 定義記錄系統(tǒng)    3.3 數(shù)據(jù)倉庫的物理模型設(shè)計(jì)     3.3.1 索引策略     3.3.2 數(shù)據(jù)存儲(chǔ)策略    3.4 數(shù)據(jù)倉庫的建立過程     3.4.1 需求分析     3.4.2 數(shù)據(jù)路線     3.4.3 技術(shù)路線     3.4.4 應(yīng)用路線     3.4.5 數(shù)據(jù)倉庫部署     3.4.6 運(yùn)行維護(hù)   3.5 提高數(shù)據(jù)倉庫性能   3.6  小結(jié)   習(xí)題 第4章 聯(lián)機(jī)分析處理    4.1  OLAP概念     4.1.1  什么是OLAP     4.1.2  OLAP的相關(guān)基本概念     4.1.3  OLAP和OLTP的區(qū)別     4.1.4  OLAP和數(shù)據(jù)倉庫的區(qū)別  ……第二篇 數(shù)據(jù)挖掘與空間數(shù)據(jù)挖掘第三篇 工具與實(shí)例主要參考文獻(xiàn)

章節(jié)摘錄

  第一篇 數(shù)據(jù)倉庫與0LAP  第1章 數(shù)據(jù)倉庫基本概念  計(jì)算機(jī)技術(shù)的迅速發(fā)展使得處理數(shù)據(jù)成為可能,這就推動(dòng)了數(shù)據(jù)庫技術(shù)的極大發(fā)展,但是面對(duì)不斷增加如潮水般的數(shù)據(jù),人們不再滿足于數(shù)據(jù)庫的查詢功能,提出了深層次問題:能不能從數(shù)據(jù)中提取蘊(yùn)藏于其中的知識(shí)為決策服務(wù)。就數(shù)據(jù)庫技術(shù)而言已經(jīng)顯得無能為力了,這就急需有新的方法和技術(shù)來處理這些海量般的數(shù)據(jù)。在這種情況下,數(shù)據(jù)庫逐步發(fā)展到了數(shù)據(jù)倉庫。世界上最早的數(shù)據(jù)倉庫是NCR公司為全美、也是全世界最大的連鎖超市集團(tuán)Wal—Mart在1981年建立的,而最早將數(shù)據(jù)倉庫提升到理論高度進(jìn)行分析并提出數(shù)據(jù)倉庫這個(gè)概念的則是著名學(xué)者W.H.Inrnon,他對(duì)數(shù)據(jù)倉庫所下的定義是:數(shù)據(jù)倉庫是一個(gè)面向主題的、集成的、穩(wěn)定的、隨時(shí)間變化的數(shù)據(jù)的集合,用于支持管理決策過程。由此可見,數(shù)據(jù)倉庫是一個(gè)綜合的解決方案,主要用來幫助企業(yè)有關(guān)主管部門和業(yè)務(wù)人員做出更符合業(yè)務(wù)發(fā)展規(guī)律的決策?! ?.1 從數(shù)據(jù)庫到數(shù)據(jù)倉庫  傳統(tǒng)數(shù)據(jù)庫以及聯(lián)機(jī)事務(wù)處理(on-line transaction processing,OLTP)在日常的管理事務(wù)處理中獲得了巨大的成功,但是對(duì)管理人員的決策分析要求卻無法滿足。因?yàn)?,管理人員常常希望能夠通過對(duì)組織中的大量數(shù)據(jù)進(jìn)行分析,了解業(yè)務(wù)的發(fā)展趨勢(shì)。而傳統(tǒng)數(shù)據(jù)庫只保留了當(dāng)前的業(yè)務(wù)處理信息,缺乏決策分析所需要的大量的歷史信息。為滿足管理人員的決策分析需要,就需要在數(shù)據(jù)庫的基礎(chǔ)上產(chǎn)生適應(yīng)決策分析的數(shù)據(jù)環(huán)境——數(shù)據(jù)倉庫(data warehose)。

圖書封面

圖書標(biāo)簽Tags

評(píng)論、評(píng)分、閱讀與下載


    數(shù)據(jù)倉庫與數(shù)據(jù)挖掘原理及應(yīng)用 PDF格式下載


用戶評(píng)論 (總計(jì)8條)

 
 

  •   數(shù)據(jù)倉庫與數(shù)據(jù)挖掘原理及應(yīng)用
  •   正好在做BI項(xiàng)目
    這本書深入淺出 寫的很不錯(cuò)
  •   書不錯(cuò),通俗易懂,適合初學(xué)者
  •   還可以吧,沒什么亮點(diǎn)
  •   東西不錯(cuò),送得也很快
  •   收到,大綱類教材
  •   比老師發(fā)的書好用。
  •   比較不錯(cuò),挺基礎(chǔ)的
 

250萬本中文圖書簡(jiǎn)介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書網(wǎng) 手機(jī)版

京ICP備13047387號(hào)-7