數(shù)據(jù)倉庫與數(shù)據(jù)挖掘原理.工具及應(yīng)用

出版時間:2007-12  出版社:中國電力  作者:潘華  頁數(shù):263  
Tag標(biāo)簽:無  

前言

為貫徹落實教育部《關(guān)于進(jìn)一步加強(qiáng)高等學(xué)校本科教學(xué)工作的若干意見》和《教育部關(guān)于以就業(yè)為導(dǎo)向深化高等職業(yè)教育改革的若干意見》的精神,加強(qiáng)教材建設(shè),確保教材質(zhì)量,中國電力教育協(xié)會組織制訂了普通高等教育“十一五”教材規(guī)劃。該規(guī)劃強(qiáng)調(diào)適應(yīng)不同層次、不同類型院校,滿足學(xué)科發(fā)展和人才培養(yǎng)的需求,堅持專業(yè)基礎(chǔ)課教材與教學(xué)急需的專業(yè)教材并重、新編與修訂相結(jié)合。本書為新編教材。自20世紀(jì)90年代以來,信息技術(shù)在我國電力系統(tǒng)的應(yīng)用得到了前所未有的發(fā)展,各級電力企業(yè)紛紛建立各種各樣的信息系統(tǒng),如辦公自動化(OA)、生產(chǎn)管理系統(tǒng)、設(shè)備管理系統(tǒng)、燃料管理系統(tǒng)、電力市場和營銷系統(tǒng)、電力調(diào)度系統(tǒng)、送電和配電地理信息系統(tǒng)、呼叫中心(Call Center)等。然而,這些信息系統(tǒng)往往是根據(jù)某個企業(yè),甚至是某個部門自身需求而設(shè)計的,信息的采集、加工和存儲大多著眼于本企業(yè)或本部門的信息,忽視了相互之間信息溝通和共享的要求。這樣建立起來的信息系統(tǒng)雖然覆蓋了各方面的信息,但同時也形成了一個個信息孤島,使得原本可以相互溝通和共享的信息被一道道“籬笆”分隔開來。2002年電力體制改革之后,電力企業(yè)解除管制的商業(yè)環(huán)境以及更加多變的電力市場,使得信息和知識成為電力公司最有價值的資源,而上述情況使得電力企業(yè)信息化最終不能構(gòu)造有效的知識管理系統(tǒng),信息傳遞困難,難以提供企業(yè)級的決策分析支持。目前的問題主要表現(xiàn)為以下幾項。(1)異構(gòu)性強(qiáng),信息集成度差。電力企業(yè)各應(yīng)用系統(tǒng)在數(shù)據(jù)建模、軟硬件平臺、應(yīng)用系統(tǒng)平臺和開發(fā)工具等方面都存在著顯著的差異,從而導(dǎo)致彼此數(shù)據(jù)交換困難,使得各個應(yīng)用系統(tǒng)在信息上成為相對孤立的“自動化孤島”,不易與其他系統(tǒng)交換數(shù)據(jù)或在企業(yè)范圍內(nèi)實現(xiàn)集成。(2)數(shù)據(jù)冗余和多信息源問題。由于建設(shè)時期的不同以及當(dāng)時技術(shù)水平的限制,造成了過量的數(shù)據(jù)冗余和多信息源等問題,使得數(shù)據(jù)資源訪問困難,難以進(jìn)行有效的決策分析。(3)缺乏企業(yè)級的決策支持系統(tǒng)。電力企業(yè)各應(yīng)用系統(tǒng)信息共享困難,管理系統(tǒng)難以跨應(yīng)用系統(tǒng)實施生產(chǎn)業(yè)務(wù)流程管理,不能構(gòu)造有效的知識管理系統(tǒng),難以提供管理層和決策層的綜合分析和輔助決策支持。數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)可以很好地解決以上問題。這種技術(shù)自20世紀(jì)90年代初開始在美國等國家流行,并在20世紀(jì)90年代中期傳人我國,現(xiàn)在已經(jīng)逐漸在我國推廣應(yīng)用,特別是在金融、電信、制造、零售等企業(yè),發(fā)揮著越來越重要的作用。相比而言,由于體制、觀念、技術(shù)、人才等方面的原因,數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術(shù)在電力行業(yè)的應(yīng)用尚處于起步階段。但是可以預(yù)測,隨著電力體制改革和行業(yè)信息化的進(jìn)一步深入,數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)將會在電力行業(yè)有很大的應(yīng)用。本書編者一直從事數(shù)據(jù)倉庫、數(shù)據(jù)挖掘方面的研究與開發(fā),所參與設(shè)計和開發(fā)的項目涉及金融、保險、電力等多個領(lǐng)域。近年來在上海電力學(xué)院也開設(shè)了相關(guān)課程。本書是在此基礎(chǔ)上編寫而成的。

內(nèi)容概要

本書為普通高等教育“十一五”規(guī)劃教材,是電力企業(yè)信息化系列教材之一。    本書全面深入介紹了數(shù)據(jù)倉庫、聯(lián)機(jī)分析處理(OLAP)和數(shù)據(jù)挖掘的基本概念、工具及實際應(yīng)用。全書分成三篇,數(shù)據(jù)倉庫與數(shù)據(jù)挖掘原理篇的主要內(nèi)容包括數(shù)據(jù)倉庫的基本概念和結(jié)構(gòu)、創(chuàng)建過程、聯(lián)機(jī)分析處理、數(shù)據(jù)挖掘的基本概念和方法等;數(shù)據(jù)倉庫與數(shù)據(jù)挖掘工具篇介紹幾個現(xiàn)在市場上主流的數(shù)據(jù)倉庫和數(shù)據(jù)挖掘工具,包括ETL工具Data Stage、商務(wù)智能工具 Congos和數(shù)據(jù)挖掘工具SAS;數(shù)據(jù)倉庫與數(shù)據(jù)挖掘應(yīng)用篇以某電力公司為例介紹一個數(shù)據(jù)倉庫應(yīng)用系統(tǒng)的建設(shè)過程,包括系統(tǒng)需求分析、系統(tǒng)架構(gòu)設(shè)計、數(shù)據(jù)模型設(shè)計、數(shù)據(jù)庫規(guī)劃、ETL開發(fā)等。    本書可作為計算機(jī)、信息管理與信息系統(tǒng)等相關(guān)專業(yè)的學(xué)生學(xué)習(xí)數(shù)據(jù)倉庫、OLAP及數(shù)據(jù)挖掘技術(shù)的實用教程,也可供從事數(shù)據(jù)倉庫、數(shù)據(jù)挖掘研究、設(shè)計、開發(fā)等工作的科研人員和工程人員參考。

書籍目錄

前言電力企業(yè)信息化系列教材序第一篇 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘原理篇 第一章 數(shù)據(jù)倉庫概述  第一節(jié) 數(shù)據(jù)倉庫的產(chǎn)生  第二節(jié) 數(shù)據(jù)倉庫的相關(guān)概念  第三節(jié) 數(shù)據(jù)倉庫與OLTP的比較  第四節(jié) 數(shù)據(jù)倉庫的發(fā)展歷程 第二章 數(shù)據(jù)倉庫的基本結(jié)構(gòu)  第一節(jié) 數(shù)據(jù)倉庫的參考架構(gòu)  第二節(jié) 數(shù)據(jù)倉庫的數(shù)據(jù)存儲和數(shù)據(jù)模型  第三節(jié) 數(shù)據(jù)加載模塊  第四節(jié) 數(shù)據(jù)分析展現(xiàn)模塊  第五節(jié) 元數(shù)據(jù)管理模塊  第六節(jié) 數(shù)據(jù)倉庫門戶管理模塊  第七節(jié) 數(shù)據(jù)倉庫監(jiān)控和日常管理 第三章 數(shù)據(jù)倉庫的構(gòu)建  第一節(jié) 數(shù)據(jù)倉庫設(shè)計開發(fā)過程  第二節(jié) 數(shù)據(jù)倉庫模型設(shè)計  第三節(jié) 數(shù)據(jù)加載設(shè)計  第四節(jié) 應(yīng)用及門戶系統(tǒng)建設(shè)  第五節(jié) 元數(shù)據(jù)管理系統(tǒng)設(shè)計 第四章 聯(lián)機(jī)分析處理  第一節(jié) OLAP概述  第二節(jié) OLAP基本操作  第三節(jié) OLAP體系結(jié)構(gòu)和分類  第四節(jié) 基于多維數(shù)據(jù)庫的OLAP  第五節(jié) 基于關(guān)系數(shù)據(jù)庫的OLAP  第六節(jié) OLAP的評價標(biāo)準(zhǔn)  第七節(jié) OLAP的前端展現(xiàn) 第五章 數(shù)據(jù)挖掘技術(shù)  第一節(jié) 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘  第二節(jié) 數(shù)據(jù)挖掘概述  第三節(jié) 數(shù)據(jù)挖掘的決策支持及其方法第二篇 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘工具篇 第六章 ETL工具——Data Stage  第一節(jié) Data Stage概述  第二節(jié) 創(chuàng)建一個Data Stage工程  第三節(jié) Data Stage作業(yè)的開發(fā)  第四節(jié) 創(chuàng)建BASIC:表達(dá)式 第七章 商務(wù)智能工具——Cognos  第一節(jié) Cognos概述  第二節(jié) Framework Manager建模過程  第三節(jié) 使用Report Studio開發(fā)固定式報表  第四節(jié) 使用Powerplay開發(fā)OLAP報表 第八章 數(shù)據(jù)挖掘工具——SAS  第一節(jié) SAS系統(tǒng)工作環(huán)境  第二節(jié) SAS程序結(jié)構(gòu)  第三節(jié) SAS數(shù)據(jù)挖掘?qū)嵗谌?數(shù)據(jù)倉庫與數(shù)據(jù)挖掘應(yīng)用篇 第九章 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘在電力行業(yè)應(yīng)用概述  第一節(jié) 電力行業(yè)信息化建設(shè)概況  第二節(jié) 數(shù)據(jù)倉庫與數(shù)據(jù)挖掘在電力行業(yè)應(yīng)用 第十章 某省電力營銷數(shù)據(jù)倉庫應(yīng)用系統(tǒng)建設(shè)  第一節(jié) 系統(tǒng)需求分析  第二節(jié) 系統(tǒng)架構(gòu)設(shè)計  第三節(jié) 數(shù)據(jù)模型設(shè)計  第四節(jié) 數(shù)據(jù)庫規(guī)劃  第五節(jié) ETL開發(fā)  第六節(jié) 系統(tǒng)實現(xiàn)參考文獻(xiàn)

章節(jié)摘錄

數(shù)據(jù)倉庫的開發(fā)應(yīng)用規(guī)劃是開發(fā)數(shù)據(jù)倉庫的首要任務(wù)。只有制定了正確的數(shù)據(jù)倉庫規(guī)劃,才能組織主要力量有序地實現(xiàn)數(shù)據(jù)倉庫的開發(fā)應(yīng)用。在數(shù)據(jù)倉庫的規(guī)劃中一般要經(jīng)歷這樣幾個步驟:選擇實現(xiàn)策略、確定數(shù)據(jù)倉庫的開發(fā)目標(biāo)和實現(xiàn)范圍、選擇數(shù)據(jù)倉庫的體系結(jié)構(gòu)、建立商業(yè)和項目規(guī)劃預(yù)算。當(dāng)數(shù)據(jù)倉庫規(guī)劃完成后,就需要編制數(shù)據(jù)倉庫的規(guī)劃說明書,說明數(shù)據(jù)倉庫與企業(yè)戰(zhàn)略的關(guān)系,以及與企業(yè)急需處理的、范圍相對有限的開發(fā)機(jī)會,重點(diǎn)支持的職能部門和今后數(shù)據(jù)倉庫開發(fā)工作的建議,實際使用的方案和開發(fā)預(yù)算,以作為數(shù)據(jù)倉庫實際開發(fā)的依據(jù)。1.選擇數(shù)據(jù)倉庫的實現(xiàn)策略數(shù)據(jù)倉庫的開發(fā)策略主要有自頂向下、自底向上以及這兩種策略的聯(lián)合使用。自頂向下策略在實際應(yīng)用中比較困難,因為數(shù)據(jù)倉庫是一種決策支持功能,這種功能在企業(yè)戰(zhàn)略的應(yīng)用范圍中常常是很難確定的,因為數(shù)據(jù)倉庫的應(yīng)用機(jī)會往往超出了企業(yè)當(dāng)前的實際業(yè)務(wù)范圍。而且,在開發(fā)前就確定目標(biāo)會在實現(xiàn)了預(yù)定的目標(biāo)后不再追求新的應(yīng)用,使數(shù)據(jù)倉庫喪失更有戰(zhàn)略意義的應(yīng)用。但是,由于該策略在開發(fā)前就可以給出數(shù)據(jù)倉庫的實現(xiàn)范圍,能夠清楚地向決策者和企業(yè)描述系統(tǒng)的收益情況和實現(xiàn)目標(biāo),因此是一種有效的數(shù)據(jù)倉庫開發(fā)策略。該方法的使用需要開發(fā)人員具有豐富的自頂向下開發(fā)系統(tǒng)的經(jīng)驗,企業(yè)決策層和管理人員完全知道數(shù)據(jù)倉庫使用的預(yù)定目標(biāo)并了解數(shù)據(jù)倉庫能夠在哪些決策中發(fā)揮作用。.自底向上策略一般從某一數(shù)據(jù)倉庫的原型開始,選擇一些特定的為企業(yè)管理人員所熟知的管理決策問題作為數(shù)據(jù)倉庫開發(fā)的對象,在此基礎(chǔ)上進(jìn)行數(shù)據(jù)倉庫的開發(fā)。因此,該策略常常用于一個數(shù)據(jù)集市或一個部門的數(shù)據(jù)倉庫的開發(fā)。該策略的優(yōu)點(diǎn)在于企業(yè)能以較小的投入獲得較高的數(shù)據(jù)倉庫應(yīng)用效益,在開發(fā)過程中,人員投入較少,也容易獲得成效。當(dāng)然,如果某個項目的開發(fā)失敗可能會造成企業(yè)整個數(shù)據(jù)倉庫系統(tǒng)開發(fā)的推遲。該策略一般用于企業(yè)希望對數(shù)據(jù)倉庫的技術(shù)進(jìn)行評價,以確定該技術(shù)的應(yīng)用方式、地點(diǎn)和時間,或希望了解實現(xiàn)和運(yùn)行數(shù)據(jù)倉庫所需要的各種費(fèi)用,或在數(shù)據(jù)倉庫的應(yīng)用目標(biāo)并不是很明確以及數(shù)據(jù)倉庫對決策過程影響不是很明確時采用。在自頂向下的開發(fā)策略中可以采用結(jié)構(gòu)化或面向?qū)ο蠓椒?。按照?shù)據(jù)倉庫的規(guī)劃、需求確定、系統(tǒng)分析、系統(tǒng)設(shè)計、系統(tǒng)集成、系統(tǒng)測試和系統(tǒng)試運(yùn)行的階段完成數(shù)據(jù)倉庫的開發(fā)。而在自底向上的開發(fā)中,則可以采用螺旋式的原型開發(fā)方法,使用戶可以根據(jù)新的需求對試運(yùn)行的系統(tǒng)進(jìn)行修改。螺旋式的原型開發(fā)方法要求在較短時間內(nèi)快速生成可以不斷增加功能的數(shù)據(jù)倉庫。螺旋式的原型開發(fā)方法適用于這樣一些場合:企業(yè)的市場動向和需求無法預(yù)測;市場的時機(jī)是實現(xiàn)產(chǎn)品的重要組成部分;不斷地改進(jìn)對于企業(yè)的市場調(diào)節(jié)是必需的;持久的競爭優(yōu)勢來自連續(xù)不斷的改進(jìn);系統(tǒng)的改進(jìn)基于用戶在使用過程中的不斷發(fā)現(xiàn)。自頂向下和自頂向上策略的聯(lián)合使用具有兩種策略的優(yōu)點(diǎn),既能夠快速地完成數(shù)據(jù)倉庫的開發(fā)與應(yīng)用,又可以建立具有長遠(yuǎn)價值的數(shù)據(jù)倉庫方案,但是在實際使用中難以操作,通常需要能夠建立、應(yīng)用和維護(hù)企業(yè)模型、數(shù)據(jù)模型和技術(shù)結(jié)構(gòu)的、具有豐富經(jīng)驗的開發(fā)分析人員,能夠熟練地從具體(如業(yè)務(wù)系統(tǒng)中的元數(shù)據(jù))轉(zhuǎn)移到抽象(只基于業(yè)務(wù)性質(zhì)而不是基于實現(xiàn)系統(tǒng)技術(shù)的邏輯模型)。企業(yè)需要擁有由最終用戶和信息系統(tǒng)人員組成的有經(jīng)驗的開發(fā)小組,能夠清楚地指出數(shù)據(jù)倉庫在企業(yè)戰(zhàn)略決策中的應(yīng)用。

編輯推薦

全書共三篇,分別是數(shù)據(jù)倉庫與數(shù)據(jù)挖掘原理篇、工具篇、應(yīng)用篇。內(nèi)容組織的思路.為:基本概念一基本原理一開發(fā)工具一實際應(yīng)用。 《普通高等教育"十一五"規(guī)劃教材?數(shù)據(jù)倉庫與數(shù)據(jù)挖掘原理、工具及應(yīng)用》在內(nèi)容介紹上力求深入淺出,通俗易懂。除理論聯(lián)系實際外,還使用了大量的圖示及實例,使得該書有較強(qiáng)的可讀性和可理解性。因此,凡具有一定數(shù)據(jù)庫基礎(chǔ)知識的人都能學(xué)會《普通高等教育"十一五"規(guī)劃教材?數(shù)據(jù)倉庫與數(shù)據(jù)挖掘原理、工具及應(yīng)用》的內(nèi)容。 《普通高等教育"十一五"規(guī)劃教材?數(shù)據(jù)倉庫與數(shù)據(jù)挖掘原理、工具及應(yīng)用》適合于企業(yè)信息化管理人員、技術(shù)人員以及軟件開發(fā)人員閱讀,也可作為在校大專、本科學(xué)生和研究生的教材。

圖書封面

圖書標(biāo)簽Tags

評論、評分、閱讀與下載


    數(shù)據(jù)倉庫與數(shù)據(jù)挖掘原理.工具及應(yīng)用 PDF格式下載


用戶評論 (總計18條)

 
 

  •   從理論到實際。這是一部關(guān)于數(shù)據(jù)挖掘不錯的入門書。推薦。
  •   主要是了解數(shù)據(jù)挖掘理論的,發(fā)現(xiàn)用得很不錯。
  •   概念較多 ,內(nèi)容講的不夠深入。不適合初學(xué)者
  •   我有這方面實際技術(shù)經(jīng)驗,再看這些理論書籍,感覺效果很好,所以推薦。
  •   服務(wù)很好。速度也很快,謝謝啦
  •   數(shù)據(jù)挖掘啟蒙教程
  •   本來是想著買一本和銀行業(yè)務(wù)有關(guān)并且用到ETL工具的書籍,但是找來找去只找到這一本,不過書的內(nèi)容還是挺不錯的
  •   主要看中它講了些ETL工具,感覺還是不錯的。
  •   全面,但比較淺,講得不是很深入。適合細(xì)讀的書。不過,細(xì)讀起來,里面有些章節(jié)的內(nèi)容有些矛盾。呵呵。
  •   書的內(nèi)容不錯,很實用,適合入門
  •   幫同學(xué)買的,據(jù)他反映這本書還算不錯
  •   剛拿到手,當(dāng)當(dāng)?shù)乃拓浰俣认喈?dāng)快,夜里下單,第二天一早到貨,書有點(diǎn)薄~
  •   書當(dāng)時是叫同學(xué)給我去拿的,感覺不錯,跟我想要的是一樣的呵呵發(fā)貨速度也不錯。。所以給個好評了呵呵以后有什么寶貝會再買的O(∩_∩)O哈哈~謝謝了。。
  •   速度挺快的。我很滿意。只是價格能不能再低點(diǎn)?
  •   幫朋友買的,到貨的速度還不錯,希望書也不錯吧。
  •   很失望,講的亂七八糟,印刷質(zhì)量也很一般
  •   該書介紹了數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的理論知識,很值得初學(xué)bi的人去看,可惜我這邊書被送來的時候整本書都被折了。
  •   對剛剛接觸這方面的讀者來說還可以,可以了解一下,不過不是很深入,就是后面他介紹了幾個工具,所以就買了
 

250萬本中文圖書簡介、評論、評分,PDF格式免費(fèi)下載。 第一圖書網(wǎng) 手機(jī)版

京ICP備13047387號-7