出版時間:2009-9 出版社:科學出版社 作者:王麗珍 等編著 頁數:296
Tag標簽:無
前言
進入信息社會以來,信息技術經歷了從計算機主機的信息集中處理方式到個人計算機(PC)的信息分布處理形式的轉變;從單一的計算機操作系統(tǒng)到計算機互聯(lián)網絡操作的改變:從客戶機/服務器(Client/Server)計算體系到多層體系結構計算模式的轉變;從單一數據庫到大型數據倉庫和從局域網到Internet全球網的改變。現代信息技術的發(fā)展和現代科學技術的進步,使人類邁入新的時期——信息化時代?! ⌒畔⑻幚砑夹g的發(fā)展使得各類數據、信息急劇增長,給數據的傳輸、存儲帶來了許多新的問題,特別是由于各類不同事務產生大量不同類型的數據,這些數據分別被許多各個時期建立的應用系統(tǒng)所使用。人們希望能夠看到所有數據和信息的綜合情況,而這些數據和信息有許多不能被統(tǒng)一描述,不能被現有應用系統(tǒng)綜合使用。針對這一問題,人們設想專門為業(yè)務的統(tǒng)計分析建立一個數據中心,它的數據來自聯(lián)機的事務處理系統(tǒng)、異構的外部數據源、脫機的歷史業(yè)務數據等,這個數據中心就是數據倉庫。數據倉庫技術的應運而生,成為信息技術領域非常熱門的話題之一?! 祿}庫技術的提出建立了一種體系化的數據存儲環(huán)境,將分析決策所需要的大量數據從傳統(tǒng)的操作環(huán)境中分離出來,使分散、不一致的操作數據轉換成集成、統(tǒng)一的信息。企業(yè)內不同單位、不同角色的成員都可以在此單一的環(huán)境之下,通過運用其中的數據與信息,發(fā)現全新的視野和新的問題,產生用于決策的新分析方法。作為決策支持系統(tǒng)的重要組成部分,數據倉庫為決策支持系統(tǒng)提供了分析決策所需的數據:OLAP的產生,則進一步增強了決策支持系統(tǒng)快速、一致和交互性的分析能力,它利用存儲在數據倉庫中的數據完成各種分析操作,并以直觀易懂的形式將分析結果展現給決策分析人員;而數據挖掘是從大量數據中提取或“挖掘”知識,從而實現從“數據一信息一知識”的過程,為企業(yè)的管理階層提供各種層次的決策支持。
內容概要
本書全面深入地介紹了數據倉庫、聯(lián)機分析處理和數據挖掘的基本概念、基本方法和應用技術。全書分成三篇:數據倉庫與OLAP篇的主要內容包括:數據倉庫的基本概念、體系結構、模型設計、開發(fā)方法、ETL、元數據和數據集市,OLAP的基本概念、基本操作、數據模型和OLAP的實現及準則;數據挖掘與空間數據挖掘篇的主要內容包括關聯(lián)分析方法、聚類分析技術、分類與預測方法、異常檢測算法以及空間數據挖掘技術等;工具與實例篇介紹了數據挖掘工具及可視化、Cognos公司的BI主要產品和企業(yè)數據倉庫系統(tǒng)構建。 本書可作為高等院校計算機軟件與應用、信息科學等專業(yè)的學生學習數據倉庫、OLAP及數據挖掘技術的實用教程或參考書,也可供從事數據倉庫、數據挖掘研究、設計、開發(fā)等工作的科研、工程人員參考。
書籍目錄
第一篇 數據倉庫與OLAP 第1章 數據倉庫基本概念 1.1 從數據庫到數據倉庫 1.1.1 蜘蛛網問題 1.1.2 事務處理和分析處理數據環(huán)境的分離 1.2 什么是數據倉庫 1.2.1 面向主題 1.2.2 集成 1.2.3 穩(wěn)定性 1.2.4 隨時間而變化 1.3 數據倉庫與傳統(tǒng)數據庫的比較 1.3.1 兩個系統(tǒng)的主要區(qū)別 1.3.2 兩個系統(tǒng)的查詢支持不同 1.3.3 兩個系統(tǒng)數據組織模式示例比較 1.4 數據倉庫的系統(tǒng)結構 1.4.1 三層數據倉庫結構 1.4.2 數據倉庫中的關鍵名詞 1.5 數據倉庫的數據組織 1.5.1 數據倉庫的數據組織結構 1.5.2 數據粒度與數據分割 1.5.3 數據倉庫的數據組織形式 1.5.4 數據倉庫的數據追加和清理 1.6 小結 習題 第2章 數據倉庫中的ETL和元數據 2.1 ETL 2.1.1 ETL概念 2.1.2 ETL作用 2.1.3 ETL工具 2.2 元數據 2.2.1 什么是元數據 2.2.2 元數據的標準化 2.2.3 數據倉庫中的元數據管理 2.2.4 在數據倉庫項目中使用元數據的建議 2.3 外部數據 2.3.1 外部數據和非結構化數據 2.3.2 元數據和外部數據 2.3.3 外部數據的存儲 2.3.4 外部數據的管理 2.4 小結 習題 第3章 數據倉庫模型設計及數據倉庫建立 3.1 數據倉庫的概念模型設計 3.1.1 E.R模型 3.1.2 面向對象的分析方法 3.2 數據倉庫的邏輯模型設計 3.2.1 分析主題,確定當前要裝載的主題 3.2.2 確定數據粒度的選擇 3.2.3 確定數據分割策略 3.2.4 增加導出字段 3.2.5 定義關系模式 3.2.6 定義記錄系統(tǒng) 3.3 數據倉庫的物理模型設計 3.3.1 索引策略 3.3.2 數據存儲策略 3.4 數據倉庫的建立過程 3.4.1 需求分析 3.4.2 數據路線 3.4.3 技術路線 3.4.4 應用路線 3.4.5 數據倉庫部署 3.4.6 運行維護 3.5 提高數據倉庫性能 3.6 小結 習題 第4章 聯(lián)機分析處理 4.1 OLAP概念 4.1.1 什么是OLAP 4.1.2 OLAP的相關基本概念 4.1.3 OLAP和OLTP的區(qū)別 4.1.4 OLAP和數據倉庫的區(qū)別 ……第二篇 數據挖掘與空間數據挖掘第三篇 工具與實例主要參考文獻
章節(jié)摘錄
第一篇 數據倉庫與0LAP 第1章 數據倉庫基本概念 計算機技術的迅速發(fā)展使得處理數據成為可能,這就推動了數據庫技術的極大發(fā)展,但是面對不斷增加如潮水般的數據,人們不再滿足于數據庫的查詢功能,提出了深層次問題:能不能從數據中提取蘊藏于其中的知識為決策服務。就數據庫技術而言已經顯得無能為力了,這就急需有新的方法和技術來處理這些海量般的數據。在這種情況下,數據庫逐步發(fā)展到了數據倉庫。世界上最早的數據倉庫是NCR公司為全美、也是全世界最大的連鎖超市集團Wal—Mart在1981年建立的,而最早將數據倉庫提升到理論高度進行分析并提出數據倉庫這個概念的則是著名學者W.H.Inrnon,他對數據倉庫所下的定義是:數據倉庫是一個面向主題的、集成的、穩(wěn)定的、隨時間變化的數據的集合,用于支持管理決策過程。由此可見,數據倉庫是一個綜合的解決方案,主要用來幫助企業(yè)有關主管部門和業(yè)務人員做出更符合業(yè)務發(fā)展規(guī)律的決策?! ?.1 從數據庫到數據倉庫 傳統(tǒng)數據庫以及聯(lián)機事務處理(on-line transaction processing,OLTP)在日常的管理事務處理中獲得了巨大的成功,但是對管理人員的決策分析要求卻無法滿足。因為,管理人員常常希望能夠通過對組織中的大量數據進行分析,了解業(yè)務的發(fā)展趨勢。而傳統(tǒng)數據庫只保留了當前的業(yè)務處理信息,缺乏決策分析所需要的大量的歷史信息。為滿足管理人員的決策分析需要,就需要在數據庫的基礎上產生適應決策分析的數據環(huán)境——數據倉庫(data warehose)。
圖書封面
圖書標簽Tags
無
評論、評分、閱讀與下載