動態(tài)數(shù)據(jù)挖掘

出版時間:2010-8  出版社:科學(xué)  作者:倪志偉//倪麗萍//劉慧婷//賈瑞玉  頁數(shù):254  
Tag標(biāo)簽:無  

前言

隨著計算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)和通信技術(shù)的發(fā)展,各行各業(yè)獲取數(shù)據(jù)的能力得到了極大的提高,數(shù)據(jù)呈現(xiàn)出海量、高維、動態(tài)的特點。傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)很難有效地對這些數(shù)據(jù)進(jìn)行分析,這成為商務(wù)智能、決策支持以及知識管理等系統(tǒng)中的一個主要瓶頸,影響了管理決策的效果。為解決這一瓶頸,動態(tài)數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生,成為當(dāng)前研究的熱點問題。動態(tài)數(shù)據(jù)挖掘是集過去、現(xiàn)在與未來于一體的動態(tài)過程,其動態(tài)性體現(xiàn)在數(shù)據(jù)的采集、處理等環(huán)節(jié)。動態(tài)數(shù)據(jù)挖掘通常以動態(tài)數(shù)據(jù)庫和實時數(shù)據(jù)庫為數(shù)據(jù)的主要來源。數(shù)據(jù)處理是動態(tài)數(shù)據(jù)挖掘的核心部分,為了適應(yīng)數(shù)據(jù)的動態(tài)變化特點,更好地挖掘動態(tài)數(shù)據(jù)中隱含的事先未知的有用信息和知識,必須改進(jìn)傳統(tǒng)的或設(shè)計新穎的數(shù)據(jù)挖掘技術(shù)。本書介紹了近年來應(yīng)用于動態(tài)數(shù)據(jù)挖掘領(lǐng)域中的幾種較為新穎的挖掘技術(shù),包括數(shù)據(jù)流挖掘、分形數(shù)據(jù)挖掘、聯(lián)機(jī)分析挖掘、經(jīng)驗?zāi)B(tài)分解以及聯(lián)系發(fā)現(xiàn)技術(shù),研究了它們的原理、特點、性能及應(yīng)用情況。全書共分為六章:第一章概述傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)和動態(tài)數(shù)據(jù)挖掘技術(shù),重點介紹動態(tài)數(shù)據(jù)挖掘技術(shù)產(chǎn)生的背景、發(fā)展概況和未來研究方向;第二章探討數(shù)據(jù)流挖掘技術(shù)及其應(yīng)用、數(shù)據(jù)流挖掘算法以及數(shù)據(jù)流管理系統(tǒng);第三章介紹分形數(shù)據(jù)挖掘技術(shù),基于分形維數(shù)的約簡、聚類、分類及其改進(jìn)算法;第四章研究聯(lián)機(jī)分析挖掘中的三個重要技術(shù)組成,即數(shù)據(jù)立方體的構(gòu)建和優(yōu)化技術(shù)、聯(lián)機(jī)分析處理查詢技術(shù)及聯(lián)機(jī)分析挖掘調(diào)度機(jī)制和挖掘算法;第五章介紹經(jīng)驗?zāi)B(tài)分解技術(shù)的基本原理、算法思想以及與其他算法結(jié)合的應(yīng)用情況;第六章介紹聯(lián)系發(fā)現(xiàn)技術(shù)的發(fā)展現(xiàn)狀、應(yīng)用情況和發(fā)展趨勢。各章內(nèi)容相對獨立又相互聯(lián)系,較為系統(tǒng)地闡述了動態(tài)數(shù)據(jù)挖掘技術(shù)的研究現(xiàn)狀。本書是合肥工業(yè)大學(xué)管理學(xué)院智能管理研究所全體研究人員近年來對動態(tài)數(shù)據(jù)挖掘技術(shù)研究與應(yīng)用中的一些研究和成果的系統(tǒng)總結(jié),得到了國家高技術(shù)研究發(fā)展計劃(863計劃)“面向制造業(yè)售后服務(wù)的商務(wù)智能關(guān)鍵技術(shù)研究”和國家自然科學(xué)基金“商務(wù)智能中的動態(tài)數(shù)據(jù)挖掘與分形技術(shù)的研究”兩個項目的資助。在撰寫書稿的過程中得到了王超、高雅卓、胡湯磊、伍章俊的大力支持和幫助。倪志偉教授負(fù)責(zé)全書策劃和大綱的制訂,并負(fù)責(zé)全書的統(tǒng)纂和修改。安徽大學(xué)劉慧婷、賈瑞玉和合肥工業(yè)大學(xué)倪麗萍為本書的校對和排版做了大量的工作。

內(nèi)容概要

動態(tài)數(shù)據(jù)挖掘是針對動態(tài)數(shù)據(jù)庫和實時數(shù)據(jù)庫進(jìn)行知識提取的數(shù)據(jù)挖掘技術(shù)。隨著信息技術(shù)的進(jìn)一步發(fā)展,對知識新穎性的需求越來越強(qiáng),采用傳統(tǒng)的靜態(tài)數(shù)據(jù)挖掘技術(shù)來分析不斷產(chǎn)生的信息無法滿足現(xiàn)實應(yīng)用的要求,對實際應(yīng)用數(shù)據(jù)源在其運(yùn)行的同時進(jìn)行動態(tài)數(shù)據(jù)挖掘得到相關(guān)知識顯得日益重要。    本書是關(guān)于動態(tài)數(shù)據(jù)挖掘相關(guān)技術(shù)及其應(yīng)用的著作,涉及數(shù)據(jù)流挖掘、分形數(shù)據(jù)挖掘、聯(lián)機(jī)分析挖掘、經(jīng)驗?zāi)B(tài)分解和聯(lián)系發(fā)現(xiàn)技術(shù)等。本書內(nèi)容新穎,融入了近年來在學(xué)術(shù)界和工程界普遍關(guān)注的諸多熱門課題,是作者及其課題組幾年來完成國家級科研項目的成果結(jié)晶。    本書可作為管理科學(xué)與工程、計算機(jī)應(yīng)用技術(shù)等學(xué)科高年級的本科生和研究生用書,也可供相關(guān)研究人員參考。

書籍目錄

前言第一章  緒論  1.1  引言  1.2  數(shù)據(jù)挖掘概述    1.2.1  數(shù)據(jù)挖掘的基本概念    1.2.2  數(shù)據(jù)挖掘技術(shù)  1.3  動態(tài)數(shù)據(jù)挖掘    1.3.1  動態(tài)數(shù)據(jù)挖掘的產(chǎn)生    1.3.2  動態(tài)數(shù)據(jù)挖掘技術(shù)概述  參考文獻(xiàn)第二章  數(shù)據(jù)流挖掘技術(shù)  2.1  概述  2.2  數(shù)據(jù)流挖掘技術(shù)    2.2.1  窗口技術(shù)    2.2.2  動態(tài)抽樣技術(shù)    2.2.3  概要數(shù)據(jù)結(jié)構(gòu)    2.2.4  更新策略  2.3  數(shù)據(jù)流挖掘算法    2.3.1  數(shù)據(jù)流聚類算法    2.3.2  數(shù)據(jù)流分類算法    2.3.3  數(shù)據(jù)流頻繁項集挖掘算法    2.3.4  多數(shù)據(jù)流挖掘算法  2.4  數(shù)據(jù)流挖掘技術(shù)的應(yīng)用    2.4.1  數(shù)據(jù)流管理系統(tǒng)    2.4.2  案例推理在數(shù)據(jù)流管理中的應(yīng)用  參考文獻(xiàn)第三章  分形數(shù)據(jù)挖掘技術(shù)  3.1  概述  3.2  數(shù)據(jù)集的分形維數(shù)    3.2.1  數(shù)據(jù)集分形維數(shù)的含義    3.2.2  數(shù)據(jù)集分形維數(shù)的計算方法  3.3  基于分形維數(shù)的約簡技術(shù)    3.3.1  分形屬性選擇及其改進(jìn)算法    3.3.2  基于分形維數(shù)的案例庫維護(hù)算法  3.4  分形聚類算法    3.4.1  基于網(wǎng)格和分形維數(shù)的聚類算法    3.4.2  基于分形維數(shù)的數(shù)據(jù)流聚類算法    3.4.3  基于多重分形的聚類層次優(yōu)化算法  3.5  分形分類與預(yù)測技術(shù)    3.5.1  分形分類技術(shù)    3.5.2  分形預(yù)測技術(shù)  3.6  分形數(shù)據(jù)挖掘技術(shù)的應(yīng)用    3.6.1  金融數(shù)據(jù)分析    3.6.2  網(wǎng)絡(luò)入侵檢測  參考文獻(xiàn)第四章  聯(lián)機(jī)分析挖掘  4.1  概述  4.2  數(shù)據(jù)立方體    4.2.1  數(shù)據(jù)立方體簡介    4.2.2  數(shù)據(jù)立方體優(yōu)化方法    4.2.3  數(shù)據(jù)立方體物化方法研究  4.3  聯(lián)機(jī)分析處理    4.3.1  OLAP概念及分類    4.3.2  支持OLAP查詢的索引技術(shù)研究    4.3.3  OLAP動態(tài)查詢方法  4.4  聯(lián)機(jī)分析挖掘    4.4.1  聯(lián)機(jī)分析挖掘簡介    4.4.2  聯(lián)機(jī)分析挖掘體系結(jié)構(gòu)    4.4.3  OLAP與數(shù)據(jù)挖掘技術(shù)的結(jié)合方法  參考文獻(xiàn)第五章  經(jīng)驗?zāi)B(tài)分解技術(shù)  5.1  概述    5.1.1  經(jīng)驗?zāi)B(tài)分解基本理論    5.1.2  經(jīng)驗?zāi)B(tài)分解研究現(xiàn)狀  5.2  基于經(jīng)驗?zāi)B(tài)分解的序列趨勢的提取    5.2.1  引言    5.2.2  基于EMD方法的序列趨勢的提取  5.3  基于經(jīng)驗?zāi)B(tài)分解的時間序列匹配算法    5.3.1  引言    5.3.2  基于交叉覆蓋算法的序列匹配算法    5.3.3  基于經(jīng)驗?zāi)B(tài)分解和覆蓋算法的序列匹配算法  5.4  基于經(jīng)驗?zāi)B(tài)分解的聚類算法    5.4.1  引言    5.4.2  基于經(jīng)驗?zāi)B(tài)分解的數(shù)據(jù)降維技術(shù)    5.4.3  基于經(jīng)驗?zāi)B(tài)分解和K-means聚類算法  5.5  基于經(jīng)驗?zāi)B(tài)分解的流數(shù)據(jù)挖掘技術(shù)    5.5.1  引言    5.5.2  基于經(jīng)驗?zāi)B(tài)分解的數(shù)據(jù)流概要生成技術(shù)  5.6  經(jīng)驗?zāi)B(tài)分解動態(tài)數(shù)據(jù)挖掘技術(shù)的應(yīng)用    5.6.1  引言    5.6.2  基于經(jīng)驗?zāi)B(tài)分解和交叉覆蓋算法的個人信用的評估    5.6.3  基于經(jīng)驗?zāi)B(tài)分解和K-means算法的客戶行為聚類  參考文獻(xiàn)第六章  聯(lián)系發(fā)現(xiàn)技術(shù)  6.1  概述  6.2  基于圖挖掘的聯(lián)系發(fā)現(xiàn)    6.2.1  圖挖掘的相關(guān)概念和定義    6.2.2  基于圖論的無監(jiān)督的聯(lián)系發(fā)現(xiàn)算法  6.3  基于一階謂詞邏輯的聯(lián)系發(fā)現(xiàn)    6.3.1  一階謂詞邏輯的相關(guān)概念和定義    6.3.2  基于ILP的聯(lián)系發(fā)現(xiàn)算法  6.4  基于聯(lián)系發(fā)現(xiàn)的結(jié)合型數(shù)據(jù)挖掘方法    6.4.1  基于相關(guān)分析和聯(lián)系發(fā)現(xiàn)的結(jié)合    6.4.2  圖熵和聯(lián)系發(fā)現(xiàn)的結(jié)合    6.4.3  概率統(tǒng)計方法和聯(lián)系發(fā)現(xiàn)的結(jié)合  6.5  聯(lián)系發(fā)現(xiàn)技術(shù)的現(xiàn)實應(yīng)用    6.5.1  聯(lián)系發(fā)現(xiàn)在反恐中的運(yùn)用    6.5.2  聯(lián)系發(fā)現(xiàn)在金融反洗錢中的運(yùn)用  參考文獻(xiàn)

章節(jié)摘錄

插圖:當(dāng)前基于數(shù)據(jù)流的數(shù)據(jù)挖掘任務(wù),例如數(shù)據(jù)流聚類、數(shù)據(jù)流分類等,大多是傳統(tǒng)靜態(tài)方法的改進(jìn),其挖掘效果很難令人滿意。因此,未來的研究重點應(yīng)該根據(jù)流數(shù)據(jù)的獨特性,結(jié)合計算理論、近似算法以及尋優(yōu)算法等,開辟一條新的思路;探索一種合適的模式結(jié)構(gòu)以加速整個系統(tǒng)挖掘進(jìn)程,優(yōu)化整個挖掘任務(wù)或系統(tǒng);設(shè)計滿足數(shù)據(jù)流挖掘需求的系統(tǒng)模型以提高數(shù)據(jù)流挖掘的效率和精度。數(shù)據(jù)流挖掘有非常廣泛的應(yīng)用領(lǐng)域,如檢測互聯(lián)網(wǎng)上的極端事件、欺詐、入侵、異常、實時交通監(jiān)控、趨勢監(jiān)控、探查性分析等。本書第二章將主要介紹一些經(jīng)典的數(shù)據(jù)流挖掘算法,在此基礎(chǔ)上結(jié)合數(shù)據(jù)流的數(shù)據(jù)形式和特點,提出一些高效的數(shù)據(jù)流挖掘算法,并將對數(shù)據(jù)流挖掘的特點和應(yīng)用進(jìn)行深入的研究。2.分形數(shù)據(jù)挖掘分形數(shù)據(jù)挖掘技術(shù)也可以稱之為基于分形維數(shù)的數(shù)據(jù)挖掘技術(shù),即利用數(shù)據(jù)集分形維數(shù)的意義對數(shù)據(jù)集進(jìn)行挖掘。數(shù)據(jù)挖掘的主要任務(wù)是從海量復(fù)雜的數(shù)據(jù)中挖掘出有用的知識從而輔助人們更好地做出決策。然而高維、動態(tài)、復(fù)雜的數(shù)據(jù)特性給數(shù)據(jù)挖掘工作帶來了很大的挑戰(zhàn)。分形技術(shù)的運(yùn)用,為更好地進(jìn)行挖掘提供了一個新的可行思路。首先,自然界中存在著很多混沌現(xiàn)象,在混沌的背后,又往往表現(xiàn)出規(guī)律性和自相似性。類似地,反映這些現(xiàn)象的數(shù)據(jù)集也存在著混沌性和自相似性,即具有分形特征。分形理論提出了一套定量描述自然界中不規(guī)則、復(fù)雜現(xiàn)象的強(qiáng)有力工具,該定量指標(biāo)為分形維數(shù)。因而利用分形維數(shù)可以更好地對數(shù)據(jù)集進(jìn)行描述。其次,分形維數(shù)所描述的是分形體的填充程度,在數(shù)據(jù)挖掘中它反映的是數(shù)據(jù)在多維空間中的分布特性,因而當(dāng)有新的數(shù)據(jù)加入之后,其分布會或多或少地發(fā)生一定的變化,相應(yīng)的分形維數(shù)也會隨之發(fā)生一定的變化。因而,利用分形維數(shù)的這種動態(tài)變化特征對數(shù)據(jù)集進(jìn)行動態(tài)挖掘是合理有效的。近年來分形數(shù)據(jù)挖掘技術(shù)的研究已經(jīng)取得了一定的成果。如果從數(shù)據(jù)挖掘研究的方向來看,目前已在屬性約簡、分類、聚類、關(guān)聯(lián)規(guī)則挖掘、預(yù)測、離群點分析、空間數(shù)據(jù)分析等方向中有了一定的運(yùn)用,并形成了相關(guān)的典型算法。如果從應(yīng)用的角度來看,分形數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)數(shù)據(jù)挖掘、金融數(shù)據(jù)分析、地理信息挖掘等領(lǐng)域有了一定的應(yīng)用。分形數(shù)據(jù)挖掘技術(shù)在運(yùn)用時主要是利用分形維數(shù)進(jìn)行的。例如,在屬性約簡中,當(dāng)屬性分形維數(shù)對整個數(shù)據(jù)集的分形維數(shù)產(chǎn)生很大影響時,則該屬性為關(guān)鍵屬性;在聚類分析時,同一類的區(qū)域,其整體與局部具有極強(qiáng)的相似性,不同類之間則相似性較弱,因而可以利用分形維數(shù)度量值作為聚類的標(biāo)準(zhǔn)。在分類分析中,可以根據(jù)類間的不同分形維數(shù)值來判斷新的數(shù)據(jù)點屬于哪一類。

編輯推薦

《動態(tài)數(shù)據(jù)挖掘》是由科學(xué)出版社出版的。

圖書封面

圖書標(biāo)簽Tags

評論、評分、閱讀與下載


    動態(tài)數(shù)據(jù)挖掘 PDF格式下載


用戶評論 (總計5條)

 
 

  •   此書介紹了相關(guān)領(lǐng)域時新知識,還有很多作者的科研成果。內(nèi)容翔實,對算法描述清晰。如果讀者具備數(shù)據(jù)挖掘相關(guān)的基礎(chǔ)知識,閱讀會受益良多。
  •   內(nèi)容充實,比較好
  •   內(nèi)容還沒怎么看,不過看起來還不錯
  •   這本書算是數(shù)據(jù)挖掘里不錯的一本書,介紹的很全面,對作者重點研究的領(lǐng)域介紹的很詳細(xì),推薦
  •   一本書不錯的書 謝謝
 

250萬本中文圖書簡介、評論、評分,PDF格式免費(fèi)下載。 第一圖書網(wǎng) 手機(jī)版

京ICP備13047387號-7