出版時間:2008-3 出版社:水利水電出版社 作者:王欣 等編著 頁數(shù):243
Tag標(biāo)簽:無
內(nèi)容概要
數(shù)據(jù)挖掘的目的在于使用所發(fā)現(xiàn)的模式幫助解釋當(dāng)前的行為或預(yù)測未來的結(jié)果。數(shù)據(jù)挖掘過程涉及下列7個研究方面:數(shù)據(jù)倉庫及OLAP技術(shù)、數(shù)據(jù)預(yù)處理、使用SQL Server Data Mining、關(guān)聯(lián)規(guī)則、分類和預(yù)測、聚類分析及時序和序列數(shù)據(jù)的挖掘?! ”緯鴮?shù)據(jù)挖掘和知識發(fā)現(xiàn)的各個方面都進(jìn)行了必要的解說,側(cè)重于用SSAS進(jìn)行數(shù)據(jù)挖掘模型的建立、挖掘結(jié)果的分析與檢驗(yàn),以及解釋與驗(yàn)證結(jié)果。本書對主要的挖掘技術(shù)提供了詳細(xì)的SQL Server 2005數(shù)據(jù)挖掘的實(shí)例,讀者通過案例來實(shí)驗(yàn)性地建立和檢驗(yàn)數(shù)據(jù)挖掘模型?! ”緯m合希望學(xué)習(xí)SQL Server 2005數(shù)據(jù)挖掘技術(shù)的讀者,可以作為數(shù)據(jù)挖掘工程師的參考用書。本書適合作為高校教學(xué)數(shù)據(jù)挖掘的教程,也是公司培訓(xùn)不可多得的參考用書。
書籍目錄
前言第1章 數(shù)據(jù)挖掘基本知識 1.1 數(shù)據(jù)挖掘的概念 1.2 數(shù)據(jù)挖掘的存儲對象 1.3 基本數(shù)據(jù)挖掘任務(wù) 1.4 數(shù)據(jù)挖掘系統(tǒng)的分類 1.5 數(shù)據(jù)挖掘的主要問題 第2章 數(shù)據(jù)倉庫及OLAP技術(shù) 2.1 數(shù)據(jù)倉庫的概念 2.2 多維數(shù)據(jù)模型 2.3 數(shù)據(jù)倉庫的系統(tǒng)結(jié)構(gòu) 2.4 數(shù)據(jù)倉庫實(shí)現(xiàn) 2.5 數(shù)據(jù)方技術(shù)的進(jìn)一步發(fā)展 2.6 由數(shù)據(jù)倉庫到數(shù)據(jù)挖掘第3章 數(shù)據(jù)預(yù)處理 3.1 數(shù)據(jù)預(yù)處理的重要性 3.2 數(shù)據(jù)集成與轉(zhuǎn)換 3.3 數(shù)據(jù)消減 3.4 離散化和概念層次樹生成第4章 使用SQL Server2005進(jìn)行數(shù)據(jù)挖掘 4.1 關(guān)于Business Intelligence Development Studio 4.2 對數(shù)據(jù)源進(jìn)行設(shè)置 4.3 創(chuàng)建和編輯模型 4.4 處理 4.5 使用模型第5章 關(guān)聯(lián)規(guī)則 第6章 分類和預(yù)測第7章 聚類分析第8章 時序和序列數(shù)據(jù)的挖掘第9章 數(shù)據(jù)挖掘的應(yīng)用和發(fā)展趨勢參考文獻(xiàn)
章節(jié)摘錄
第1章 數(shù)據(jù)挖掘基本知識數(shù)據(jù)挖掘作為一個新興的多學(xué)科交叉應(yīng)用領(lǐng)域,正在各行各業(yè)的決策支持活動中扮演著越來越重要的角色。本章將從數(shù)據(jù)管理技術(shù)演化的角度介紹數(shù)據(jù)挖掘的由來、作用和意義。同時還將介紹數(shù)據(jù)挖掘系統(tǒng)的結(jié)構(gòu)、數(shù)據(jù)挖掘所獲得的知識種類,以及數(shù)據(jù)挖掘系統(tǒng)的分類。最后還簡要介紹了當(dāng)前數(shù)據(jù)挖掘領(lǐng)域尚存在的一些熱點(diǎn)問題。本章內(nèi)容包括:數(shù)據(jù)挖掘的概念數(shù)據(jù)挖掘的存儲對象基本數(shù)據(jù)挖掘任務(wù)數(shù)據(jù)挖掘系統(tǒng)的分類數(shù)據(jù)挖掘的主要問題1.1 數(shù)據(jù)挖掘的概念數(shù)據(jù)挖掘,比較公認(rèn)的定義是W.J.Frawley、G.PiantetskyShapir0等人提出來的;數(shù)據(jù)挖掘就是從大型數(shù)據(jù)庫的數(shù)據(jù)中提取人們感興趣的知識。這些知識是隱含的、實(shí)現(xiàn)未知的潛在的有用信息,提取的知識表示為概念、規(guī)則、規(guī)律、模式等形式。這里把數(shù)據(jù)挖掘的對象定義為數(shù)據(jù)庫,更廣義的說法是:數(shù)據(jù)挖掘意味著在一些事實(shí)或者觀察數(shù)據(jù)的集合中尋找模式的決策支持過程。數(shù)據(jù)挖掘的對象不僅可以是數(shù)據(jù)庫,也可以是文件系統(tǒng),或者其他任何組織在一起的數(shù)據(jù)幾何,例如WWw信息資源。本書在討論數(shù)據(jù)挖掘時采用數(shù)據(jù)庫觀點(diǎn),即著重強(qiáng)調(diào)大型數(shù)據(jù)庫(SQL Server 2005)中有效的和可規(guī)?;臄?shù)據(jù)挖掘技術(shù)。一個算法是可以規(guī)模化的,對于給定的內(nèi)存和磁盤空間等可利用的系統(tǒng)資源,其運(yùn)行時間隨數(shù)據(jù)庫大小線性增長。通過數(shù)據(jù)挖掘,可以從數(shù)據(jù)庫提取有趣的知識、規(guī)律或高層次信息,并可以從不同角度觀察或?yàn)g覽。發(fā)現(xiàn)的知識可以用于決策、過程控制、信息管理、查詢處理等。因此,數(shù)據(jù)挖掘被信息產(chǎn)業(yè)界認(rèn)為是數(shù)據(jù)庫系統(tǒng)重要的前沿之一,是信息產(chǎn)業(yè)最有前途的交叉學(xué)科。隨著數(shù)據(jù)庫技術(shù)的迅速發(fā)展以及數(shù)據(jù)庫管理系統(tǒng)的廣泛應(yīng)用,人們積累的數(shù)據(jù)越來越多。激增的數(shù)據(jù)背后隱藏著許多重要的信息,人們希望能夠?qū)ζ溥M(jìn)行更高層次的分析,以便更好地利用這些數(shù)據(jù)。目前的數(shù)據(jù)庫系統(tǒng)可以高效地實(shí)現(xiàn)數(shù)據(jù)的錄入、查詢、統(tǒng)計等功能,但無法發(fā)現(xiàn)數(shù)據(jù)中存在的關(guān)系和規(guī)則,無法根據(jù)現(xiàn)有的數(shù)據(jù)預(yù)測未來的發(fā)展趨勢。缺乏挖掘數(shù)據(jù)背后隱藏的知識的手段,導(dǎo)致了“數(shù)據(jù)爆炸但知識貧乏”的現(xiàn)象。
編輯推薦
《SQL Server 2005數(shù)據(jù)挖掘?qū)嵗治觥逢U述了數(shù)據(jù)挖掘的部分原理以及使用SSAS進(jìn)行數(shù)據(jù)挖掘的基本方法和各種可視化工具?!禨QL Server 2005數(shù)據(jù)挖掘?qū)嵗治觥愤€針對不同的挖掘模型設(shè)計了實(shí)用的案例,幫助讀者深入理解數(shù)據(jù)挖掘和熟悉SSAS。對于數(shù)據(jù)挖掘的用戶而言,《SQL Server 2005數(shù)據(jù)挖掘?qū)嵗治觥穼⒊蔀樗麄兊娜腴T工具和實(shí)踐指南。相信大多數(shù)數(shù)據(jù)庫管理人員、IT專業(yè)人員和數(shù)據(jù)挖掘方面的學(xué)生都會從《SQL Server 2005數(shù)據(jù)挖掘?qū)嵗治觥分蝎@益。
圖書封面
圖書標(biāo)簽Tags
無
評論、評分、閱讀與下載
SQL Server 2005數(shù)據(jù)挖掘?qū)嵗治?PDF格式下載