數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘原理及應(yīng)用

出版時(shí)間:2009-9  出版社:科學(xué)出版社  作者:王麗珍 等編著  頁(yè)數(shù):296  
Tag標(biāo)簽:無(wú)  

前言

  進(jìn)入信息社會(huì)以來(lái),信息技術(shù)經(jīng)歷了從計(jì)算機(jī)主機(jī)的信息集中處理方式到個(gè)人計(jì)算機(jī)(PC)的信息分布處理形式的轉(zhuǎn)變;從單一的計(jì)算機(jī)操作系統(tǒng)到計(jì)算機(jī)互聯(lián)網(wǎng)絡(luò)操作的改變:從客戶機(jī)/服務(wù)器(Client/Server)計(jì)算體系到多層體系結(jié)構(gòu)計(jì)算模式的轉(zhuǎn)變;從單一數(shù)據(jù)庫(kù)到大型數(shù)據(jù)倉(cāng)庫(kù)和從局域網(wǎng)到Internet全球網(wǎng)的改變。現(xiàn)代信息技術(shù)的發(fā)展和現(xiàn)代科學(xué)技術(shù)的進(jìn)步,使人類邁入新的時(shí)期——信息化時(shí)代?! ⌒畔⑻幚砑夹g(shù)的發(fā)展使得各類數(shù)據(jù)、信息急劇增長(zhǎng),給數(shù)據(jù)的傳輸、存儲(chǔ)帶來(lái)了許多新的問(wèn)題,特別是由于各類不同事務(wù)產(chǎn)生大量不同類型的數(shù)據(jù),這些數(shù)據(jù)分別被許多各個(gè)時(shí)期建立的應(yīng)用系統(tǒng)所使用。人們希望能夠看到所有數(shù)據(jù)和信息的綜合情況,而這些數(shù)據(jù)和信息有許多不能被統(tǒng)一描述,不能被現(xiàn)有應(yīng)用系統(tǒng)綜合使用。針對(duì)這一問(wèn)題,人們?cè)O(shè)想專門為業(yè)務(wù)的統(tǒng)計(jì)分析建立一個(gè)數(shù)據(jù)中心,它的數(shù)據(jù)來(lái)自聯(lián)機(jī)的事務(wù)處理系統(tǒng)、異構(gòu)的外部數(shù)據(jù)源、脫機(jī)的歷史業(yè)務(wù)數(shù)據(jù)等,這個(gè)數(shù)據(jù)中心就是數(shù)據(jù)倉(cāng)庫(kù)。數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的應(yīng)運(yùn)而生,成為信息技術(shù)領(lǐng)域非常熱門的話題之一?! ?shù)據(jù)倉(cāng)庫(kù)技術(shù)的提出建立了一種體系化的數(shù)據(jù)存儲(chǔ)環(huán)境,將分析決策所需要的大量數(shù)據(jù)從傳統(tǒng)的操作環(huán)境中分離出來(lái),使分散、不一致的操作數(shù)據(jù)轉(zhuǎn)換成集成、統(tǒng)一的信息。企業(yè)內(nèi)不同單位、不同角色的成員都可以在此單一的環(huán)境之下,通過(guò)運(yùn)用其中的數(shù)據(jù)與信息,發(fā)現(xiàn)全新的視野和新的問(wèn)題,產(chǎn)生用于決策的新分析方法。作為決策支持系統(tǒng)的重要組成部分,數(shù)據(jù)倉(cāng)庫(kù)為決策支持系統(tǒng)提供了分析決策所需的數(shù)據(jù):OLAP的產(chǎn)生,則進(jìn)一步增強(qiáng)了決策支持系統(tǒng)快速、一致和交互性的分析能力,它利用存儲(chǔ)在數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)完成各種分析操作,并以直觀易懂的形式將分析結(jié)果展現(xiàn)給決策分析人員;而數(shù)據(jù)挖掘是從大量數(shù)據(jù)中提取或“挖掘”知識(shí),從而實(shí)現(xiàn)從“數(shù)據(jù)一信息一知識(shí)”的過(guò)程,為企業(yè)的管理階層提供各種層次的決策支持。

內(nèi)容概要

本書(shū)全面深入地介紹了數(shù)據(jù)倉(cāng)庫(kù)、聯(lián)機(jī)分析處理和數(shù)據(jù)挖掘的基本概念、基本方法和應(yīng)用技術(shù)。全書(shū)分成三篇:數(shù)據(jù)倉(cāng)庫(kù)與OLAP篇的主要內(nèi)容包括:數(shù)據(jù)倉(cāng)庫(kù)的基本概念、體系結(jié)構(gòu)、模型設(shè)計(jì)、開(kāi)發(fā)方法、ETL、元數(shù)據(jù)和數(shù)據(jù)集市,OLAP的基本概念、基本操作、數(shù)據(jù)模型和OLAP的實(shí)現(xiàn)及準(zhǔn)則;數(shù)據(jù)挖掘與空間數(shù)據(jù)挖掘篇的主要內(nèi)容包括關(guān)聯(lián)分析方法、聚類分析技術(shù)、分類與預(yù)測(cè)方法、異常檢測(cè)算法以及空間數(shù)據(jù)挖掘技術(shù)等;工具與實(shí)例篇介紹了數(shù)據(jù)挖掘工具及可視化、Cognos公司的BI主要產(chǎn)品和企業(yè)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)構(gòu)建。    本書(shū)可作為高等院校計(jì)算機(jī)軟件與應(yīng)用、信息科學(xué)等專業(yè)的學(xué)生學(xué)習(xí)數(shù)據(jù)倉(cāng)庫(kù)、OLAP及數(shù)據(jù)挖掘技術(shù)的實(shí)用教程或參考書(shū),也可供從事數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)挖掘研究、設(shè)計(jì)、開(kāi)發(fā)等工作的科研、工程人員參考。

書(shū)籍目錄

第一篇 數(shù)據(jù)倉(cāng)庫(kù)與OLAP 第1章 數(shù)據(jù)倉(cāng)庫(kù)基本概念    1.1  從數(shù)據(jù)庫(kù)到數(shù)據(jù)倉(cāng)庫(kù)     1.1.1 蜘蛛網(wǎng)問(wèn)題     1.1.2 事務(wù)處理和分析處理數(shù)據(jù)環(huán)境的分離    1.2 什么是數(shù)據(jù)倉(cāng)庫(kù)     1.2.1 面向主題     1.2.2 集成     1.2.3 穩(wěn)定性     1.2.4 隨時(shí)間而變化    1.3 數(shù)據(jù)倉(cāng)庫(kù)與傳統(tǒng)數(shù)據(jù)庫(kù)的比較     1.3.1 兩個(gè)系統(tǒng)的主要區(qū)別     1.3.2 兩個(gè)系統(tǒng)的查詢支持不同     1.3.3 兩個(gè)系統(tǒng)數(shù)據(jù)組織模式示例比較    1.4 數(shù)據(jù)倉(cāng)庫(kù)的系統(tǒng)結(jié)構(gòu)     1.4.1 三層數(shù)據(jù)倉(cāng)庫(kù)結(jié)構(gòu)     1.4.2 數(shù)據(jù)倉(cāng)庫(kù)中的關(guān)鍵名詞    1.5 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織     1.5.1 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織結(jié)構(gòu)     1.5.2 數(shù)據(jù)粒度與數(shù)據(jù)分割     1.5.3 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織形式     1.5.4 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)追加和清理    1.6  小結(jié)    習(xí)題 第2章 數(shù)據(jù)倉(cāng)庫(kù)中的ETL和元數(shù)據(jù)    2.1  ETL     2.1.1  ETL概念     2.1.2  ETL作用     2.1.3  ETL工具   2.2 元數(shù)據(jù)     2.2.1 什么是元數(shù)據(jù)     2.2.2 元數(shù)據(jù)的標(biāo)準(zhǔn)化     2.2.3 數(shù)據(jù)倉(cāng)庫(kù)中的元數(shù)據(jù)管理     2.2.4 在數(shù)據(jù)倉(cāng)庫(kù)項(xiàng)目中使用元數(shù)據(jù)的建議   2.3 外部數(shù)據(jù)     2.3.1 外部數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)     2.3.2 元數(shù)據(jù)和外部數(shù)據(jù)     2.3.3 外部數(shù)據(jù)的存儲(chǔ)     2.3.4 外部數(shù)據(jù)的管理    2.4  小結(jié)    習(xí)題 第3章 數(shù)據(jù)倉(cāng)庫(kù)模型設(shè)計(jì)及數(shù)據(jù)倉(cāng)庫(kù)建立    3.1 數(shù)據(jù)倉(cāng)庫(kù)的概念模型設(shè)計(jì)     3.1.1 E.R模型     3.1.2 面向?qū)ο蟮姆治龇椒ā? 3.2 數(shù)據(jù)倉(cāng)庫(kù)的邏輯模型設(shè)計(jì)     3.2.1 分析主題,確定當(dāng)前要裝載的主題     3.2.2 確定數(shù)據(jù)粒度的選擇     3.2.3 確定數(shù)據(jù)分割策略     3.2.4 增加導(dǎo)出字段     3.2.5 定義關(guān)系模式     3.2.6 定義記錄系統(tǒng)    3.3 數(shù)據(jù)倉(cāng)庫(kù)的物理模型設(shè)計(jì)     3.3.1 索引策略     3.3.2 數(shù)據(jù)存儲(chǔ)策略    3.4 數(shù)據(jù)倉(cāng)庫(kù)的建立過(guò)程     3.4.1 需求分析     3.4.2 數(shù)據(jù)路線     3.4.3 技術(shù)路線     3.4.4 應(yīng)用路線     3.4.5 數(shù)據(jù)倉(cāng)庫(kù)部署     3.4.6 運(yùn)行維護(hù)   3.5 提高數(shù)據(jù)倉(cāng)庫(kù)性能   3.6  小結(jié)   習(xí)題 第4章 聯(lián)機(jī)分析處理    4.1  OLAP概念     4.1.1  什么是OLAP     4.1.2  OLAP的相關(guān)基本概念     4.1.3  OLAP和OLTP的區(qū)別     4.1.4  OLAP和數(shù)據(jù)倉(cāng)庫(kù)的區(qū)別  ……第二篇 數(shù)據(jù)挖掘與空間數(shù)據(jù)挖掘第三篇 工具與實(shí)例主要參考文獻(xiàn)

章節(jié)摘錄

  第一篇 數(shù)據(jù)倉(cāng)庫(kù)與0LAP  第1章 數(shù)據(jù)倉(cāng)庫(kù)基本概念  計(jì)算機(jī)技術(shù)的迅速發(fā)展使得處理數(shù)據(jù)成為可能,這就推動(dòng)了數(shù)據(jù)庫(kù)技術(shù)的極大發(fā)展,但是面對(duì)不斷增加如潮水般的數(shù)據(jù),人們不再滿足于數(shù)據(jù)庫(kù)的查詢功能,提出了深層次問(wèn)題:能不能從數(shù)據(jù)中提取蘊(yùn)藏于其中的知識(shí)為決策服務(wù)。就數(shù)據(jù)庫(kù)技術(shù)而言已經(jīng)顯得無(wú)能為力了,這就急需有新的方法和技術(shù)來(lái)處理這些海量般的數(shù)據(jù)。在這種情況下,數(shù)據(jù)庫(kù)逐步發(fā)展到了數(shù)據(jù)倉(cāng)庫(kù)。世界上最早的數(shù)據(jù)倉(cāng)庫(kù)是NCR公司為全美、也是全世界最大的連鎖超市集團(tuán)Wal—Mart在1981年建立的,而最早將數(shù)據(jù)倉(cāng)庫(kù)提升到理論高度進(jìn)行分析并提出數(shù)據(jù)倉(cāng)庫(kù)這個(gè)概念的則是著名學(xué)者W.H.Inrnon,他對(duì)數(shù)據(jù)倉(cāng)庫(kù)所下的定義是:數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)面向主題的、集成的、穩(wěn)定的、隨時(shí)間變化的數(shù)據(jù)的集合,用于支持管理決策過(guò)程。由此可見(jiàn),數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)綜合的解決方案,主要用來(lái)幫助企業(yè)有關(guān)主管部門和業(yè)務(wù)人員做出更符合業(yè)務(wù)發(fā)展規(guī)律的決策?! ?.1 從數(shù)據(jù)庫(kù)到數(shù)據(jù)倉(cāng)庫(kù)  傳統(tǒng)數(shù)據(jù)庫(kù)以及聯(lián)機(jī)事務(wù)處理(on-line transaction processing,OLTP)在日常的管理事務(wù)處理中獲得了巨大的成功,但是對(duì)管理人員的決策分析要求卻無(wú)法滿足。因?yàn)椋芾砣藛T常常希望能夠通過(guò)對(duì)組織中的大量數(shù)據(jù)進(jìn)行分析,了解業(yè)務(wù)的發(fā)展趨勢(shì)。而傳統(tǒng)數(shù)據(jù)庫(kù)只保留了當(dāng)前的業(yè)務(wù)處理信息,缺乏決策分析所需要的大量的歷史信息。為滿足管理人員的決策分析需要,就需要在數(shù)據(jù)庫(kù)的基礎(chǔ)上產(chǎn)生適應(yīng)決策分析的數(shù)據(jù)環(huán)境——數(shù)據(jù)倉(cāng)庫(kù)(data warehose)。

圖書(shū)封面

圖書(shū)標(biāo)簽Tags

無(wú)

評(píng)論、評(píng)分、閱讀與下載


    數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘原理及應(yīng)用 PDF格式下載


用戶評(píng)論 (總計(jì)8條)

 
 

  •   數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘原理及應(yīng)用
  •   正好在做BI項(xiàng)目
    這本書(shū)深入淺出 寫的很不錯(cuò)
  •   書(shū)不錯(cuò),通俗易懂,適合初學(xué)者
  •   還可以吧,沒(méi)什么亮點(diǎn)
  •   東西不錯(cuò),送得也很快
  •   收到,大綱類教材
  •   比老師發(fā)的書(shū)好用。
  •   比較不錯(cuò),挺基礎(chǔ)的
 

250萬(wàn)本中文圖書(shū)簡(jiǎn)介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書(shū)網(wǎng) 手機(jī)版

京ICP備13047387號(hào)-7