數(shù)據(jù)倉庫與數(shù)據(jù)挖掘原理及應用

出版時間:2009-9  出版社:科學出版社  作者:王麗珍 等編著  頁數(shù):296  
Tag標簽:無  

前言

  進入信息社會以來,信息技術經(jīng)歷了從計算機主機的信息集中處理方式到個人計算機(PC)的信息分布處理形式的轉(zhuǎn)變;從單一的計算機操作系統(tǒng)到計算機互聯(lián)網(wǎng)絡操作的改變:從客戶機/服務器(Client/Server)計算體系到多層體系結構計算模式的轉(zhuǎn)變;從單一數(shù)據(jù)庫到大型數(shù)據(jù)倉庫和從局域網(wǎng)到Internet全球網(wǎng)的改變。現(xiàn)代信息技術的發(fā)展和現(xiàn)代科學技術的進步,使人類邁入新的時期——信息化時代?! ⌒畔⑻幚砑夹g的發(fā)展使得各類數(shù)據(jù)、信息急劇增長,給數(shù)據(jù)的傳輸、存儲帶來了許多新的問題,特別是由于各類不同事務產(chǎn)生大量不同類型的數(shù)據(jù),這些數(shù)據(jù)分別被許多各個時期建立的應用系統(tǒng)所使用。人們希望能夠看到所有數(shù)據(jù)和信息的綜合情況,而這些數(shù)據(jù)和信息有許多不能被統(tǒng)一描述,不能被現(xiàn)有應用系統(tǒng)綜合使用。針對這一問題,人們設想專門為業(yè)務的統(tǒng)計分析建立一個數(shù)據(jù)中心,它的數(shù)據(jù)來自聯(lián)機的事務處理系統(tǒng)、異構的外部數(shù)據(jù)源、脫機的歷史業(yè)務數(shù)據(jù)等,這個數(shù)據(jù)中心就是數(shù)據(jù)倉庫。數(shù)據(jù)倉庫技術的應運而生,成為信息技術領域非常熱門的話題之一?! ?shù)據(jù)倉庫技術的提出建立了一種體系化的數(shù)據(jù)存儲環(huán)境,將分析決策所需要的大量數(shù)據(jù)從傳統(tǒng)的操作環(huán)境中分離出來,使分散、不一致的操作數(shù)據(jù)轉(zhuǎn)換成集成、統(tǒng)一的信息。企業(yè)內(nèi)不同單位、不同角色的成員都可以在此單一的環(huán)境之下,通過運用其中的數(shù)據(jù)與信息,發(fā)現(xiàn)全新的視野和新的問題,產(chǎn)生用于決策的新分析方法。作為決策支持系統(tǒng)的重要組成部分,數(shù)據(jù)倉庫為決策支持系統(tǒng)提供了分析決策所需的數(shù)據(jù):OLAP的產(chǎn)生,則進一步增強了決策支持系統(tǒng)快速、一致和交互性的分析能力,它利用存儲在數(shù)據(jù)倉庫中的數(shù)據(jù)完成各種分析操作,并以直觀易懂的形式將分析結果展現(xiàn)給決策分析人員;而數(shù)據(jù)挖掘是從大量數(shù)據(jù)中提取或“挖掘”知識,從而實現(xiàn)從“數(shù)據(jù)一信息一知識”的過程,為企業(yè)的管理階層提供各種層次的決策支持。

內(nèi)容概要

本書全面深入地介紹了數(shù)據(jù)倉庫、聯(lián)機分析處理和數(shù)據(jù)挖掘的基本概念、基本方法和應用技術。全書分成三篇:數(shù)據(jù)倉庫與OLAP篇的主要內(nèi)容包括:數(shù)據(jù)倉庫的基本概念、體系結構、模型設計、開發(fā)方法、ETL、元數(shù)據(jù)和數(shù)據(jù)集市,OLAP的基本概念、基本操作、數(shù)據(jù)模型和OLAP的實現(xiàn)及準則;數(shù)據(jù)挖掘與空間數(shù)據(jù)挖掘篇的主要內(nèi)容包括關聯(lián)分析方法、聚類分析技術、分類與預測方法、異常檢測算法以及空間數(shù)據(jù)挖掘技術等;工具與實例篇介紹了數(shù)據(jù)挖掘工具及可視化、Cognos公司的BI主要產(chǎn)品和企業(yè)數(shù)據(jù)倉庫系統(tǒng)構建。    本書可作為高等院校計算機軟件與應用、信息科學等專業(yè)的學生學習數(shù)據(jù)倉庫、OLAP及數(shù)據(jù)挖掘技術的實用教程或參考書,也可供從事數(shù)據(jù)倉庫、數(shù)據(jù)挖掘研究、設計、開發(fā)等工作的科研、工程人員參考。

書籍目錄

第一篇 數(shù)據(jù)倉庫與OLAP 第1章 數(shù)據(jù)倉庫基本概念    1.1  從數(shù)據(jù)庫到數(shù)據(jù)倉庫     1.1.1 蜘蛛網(wǎng)問題     1.1.2 事務處理和分析處理數(shù)據(jù)環(huán)境的分離    1.2 什么是數(shù)據(jù)倉庫     1.2.1 面向主題     1.2.2 集成     1.2.3 穩(wěn)定性     1.2.4 隨時間而變化    1.3 數(shù)據(jù)倉庫與傳統(tǒng)數(shù)據(jù)庫的比較     1.3.1 兩個系統(tǒng)的主要區(qū)別     1.3.2 兩個系統(tǒng)的查詢支持不同     1.3.3 兩個系統(tǒng)數(shù)據(jù)組織模式示例比較    1.4 數(shù)據(jù)倉庫的系統(tǒng)結構     1.4.1 三層數(shù)據(jù)倉庫結構     1.4.2 數(shù)據(jù)倉庫中的關鍵名詞    1.5 數(shù)據(jù)倉庫的數(shù)據(jù)組織     1.5.1 數(shù)據(jù)倉庫的數(shù)據(jù)組織結構     1.5.2 數(shù)據(jù)粒度與數(shù)據(jù)分割     1.5.3 數(shù)據(jù)倉庫的數(shù)據(jù)組織形式     1.5.4 數(shù)據(jù)倉庫的數(shù)據(jù)追加和清理    1.6  小結    習題 第2章 數(shù)據(jù)倉庫中的ETL和元數(shù)據(jù)    2.1  ETL     2.1.1  ETL概念     2.1.2  ETL作用     2.1.3  ETL工具   2.2 元數(shù)據(jù)     2.2.1 什么是元數(shù)據(jù)     2.2.2 元數(shù)據(jù)的標準化     2.2.3 數(shù)據(jù)倉庫中的元數(shù)據(jù)管理     2.2.4 在數(shù)據(jù)倉庫項目中使用元數(shù)據(jù)的建議   2.3 外部數(shù)據(jù)     2.3.1 外部數(shù)據(jù)和非結構化數(shù)據(jù)     2.3.2 元數(shù)據(jù)和外部數(shù)據(jù)     2.3.3 外部數(shù)據(jù)的存儲     2.3.4 外部數(shù)據(jù)的管理    2.4  小結    習題 第3章 數(shù)據(jù)倉庫模型設計及數(shù)據(jù)倉庫建立    3.1 數(shù)據(jù)倉庫的概念模型設計     3.1.1 E.R模型     3.1.2 面向?qū)ο蟮姆治龇椒ā? 3.2 數(shù)據(jù)倉庫的邏輯模型設計     3.2.1 分析主題,確定當前要裝載的主題     3.2.2 確定數(shù)據(jù)粒度的選擇     3.2.3 確定數(shù)據(jù)分割策略     3.2.4 增加導出字段     3.2.5 定義關系模式     3.2.6 定義記錄系統(tǒng)    3.3 數(shù)據(jù)倉庫的物理模型設計     3.3.1 索引策略     3.3.2 數(shù)據(jù)存儲策略    3.4 數(shù)據(jù)倉庫的建立過程     3.4.1 需求分析     3.4.2 數(shù)據(jù)路線     3.4.3 技術路線     3.4.4 應用路線     3.4.5 數(shù)據(jù)倉庫部署     3.4.6 運行維護   3.5 提高數(shù)據(jù)倉庫性能   3.6  小結   習題 第4章 聯(lián)機分析處理    4.1  OLAP概念     4.1.1  什么是OLAP     4.1.2  OLAP的相關基本概念     4.1.3  OLAP和OLTP的區(qū)別     4.1.4  OLAP和數(shù)據(jù)倉庫的區(qū)別  ……第二篇 數(shù)據(jù)挖掘與空間數(shù)據(jù)挖掘第三篇 工具與實例主要參考文獻

章節(jié)摘錄

  第一篇 數(shù)據(jù)倉庫與0LAP  第1章 數(shù)據(jù)倉庫基本概念  計算機技術的迅速發(fā)展使得處理數(shù)據(jù)成為可能,這就推動了數(shù)據(jù)庫技術的極大發(fā)展,但是面對不斷增加如潮水般的數(shù)據(jù),人們不再滿足于數(shù)據(jù)庫的查詢功能,提出了深層次問題:能不能從數(shù)據(jù)中提取蘊藏于其中的知識為決策服務。就數(shù)據(jù)庫技術而言已經(jīng)顯得無能為力了,這就急需有新的方法和技術來處理這些海量般的數(shù)據(jù)。在這種情況下,數(shù)據(jù)庫逐步發(fā)展到了數(shù)據(jù)倉庫。世界上最早的數(shù)據(jù)倉庫是NCR公司為全美、也是全世界最大的連鎖超市集團Wal—Mart在1981年建立的,而最早將數(shù)據(jù)倉庫提升到理論高度進行分析并提出數(shù)據(jù)倉庫這個概念的則是著名學者W.H.Inrnon,他對數(shù)據(jù)倉庫所下的定義是:數(shù)據(jù)倉庫是一個面向主題的、集成的、穩(wěn)定的、隨時間變化的數(shù)據(jù)的集合,用于支持管理決策過程。由此可見,數(shù)據(jù)倉庫是一個綜合的解決方案,主要用來幫助企業(yè)有關主管部門和業(yè)務人員做出更符合業(yè)務發(fā)展規(guī)律的決策?! ?.1 從數(shù)據(jù)庫到數(shù)據(jù)倉庫  傳統(tǒng)數(shù)據(jù)庫以及聯(lián)機事務處理(on-line transaction processing,OLTP)在日常的管理事務處理中獲得了巨大的成功,但是對管理人員的決策分析要求卻無法滿足。因為,管理人員常常希望能夠通過對組織中的大量數(shù)據(jù)進行分析,了解業(yè)務的發(fā)展趨勢。而傳統(tǒng)數(shù)據(jù)庫只保留了當前的業(yè)務處理信息,缺乏決策分析所需要的大量的歷史信息。為滿足管理人員的決策分析需要,就需要在數(shù)據(jù)庫的基礎上產(chǎn)生適應決策分析的數(shù)據(jù)環(huán)境——數(shù)據(jù)倉庫(data warehose)。

圖書封面

圖書標簽Tags

評論、評分、閱讀與下載


    數(shù)據(jù)倉庫與數(shù)據(jù)挖掘原理及應用 PDF格式下載


用戶評論 (總計8條)

 
 

  •   數(shù)據(jù)倉庫與數(shù)據(jù)挖掘原理及應用
  •   正好在做BI項目
    這本書深入淺出 寫的很不錯
  •   書不錯,通俗易懂,適合初學者
  •   還可以吧,沒什么亮點
  •   東西不錯,送得也很快
  •   收到,大綱類教材
  •   比老師發(fā)的書好用。
  •   比較不錯,挺基礎的
 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7