數(shù)據(jù)挖掘原理與算法

出版時間:2009-8  出版社:科學(xué)出版社  作者:邵峰晶 等編著  頁數(shù):412  
Tag標簽:無  

前言

數(shù)據(jù)挖掘經(jīng)過十幾年的蓬勃發(fā)展,產(chǎn)生了豐碩的理論和應(yīng)用成果。作為一門應(yīng)用性較強的學(xué)科,數(shù)據(jù)挖掘技術(shù)已經(jīng)滲透到國民經(jīng)濟的各個領(lǐng)域,引起學(xué)術(shù)界和產(chǎn)業(yè)界的極大關(guān)注,取得了廣泛的應(yīng)用,為各行各業(yè)的管理者提供了有價值的決策依據(jù)。這些都使我們迫切感覺到要對本書第一版進行大的修訂,補充最新的理論和應(yīng)用成果,以適應(yīng)當前學(xué)科發(fā)展的需要。本書自第一版出版以來,我們把其作為高年級學(xué)生和研究生學(xué)習(xí)數(shù)據(jù)挖掘課程的教材,取得了不少的教學(xué)經(jīng)驗,也發(fā)現(xiàn)了原書中的個別錯誤以及敘述不清楚的地方。第二版在原書的基礎(chǔ)上,對原稿進行了改正并做了較大的更新,對內(nèi)容進行了重新組織和整理,對數(shù)據(jù)挖掘中新出現(xiàn)的關(guān)鍵技術(shù)進行了介紹,詳細描述了部分典型新算法;并根據(jù)作者近年來的研究成果增添了數(shù)據(jù)挖掘的應(yīng)用章節(jié),對數(shù)據(jù)挖掘的應(yīng)用成果進行了論述;同時,對數(shù)據(jù)挖掘的最新進展進行了介紹和概括總結(jié)。這些有助于讀者系統(tǒng)學(xué)習(xí)數(shù)據(jù)挖掘理論、技術(shù)和方法,通過應(yīng)用實例的介紹能夠給讀者更加深刻的認識。我們希望本書第二版的出版,不僅給學(xué)習(xí)數(shù)據(jù)挖掘課程的高年級學(xué)生和研究生提供一本內(nèi)容比較全面的教材,而且也為開發(fā)數(shù)據(jù)挖掘相關(guān)系統(tǒng)的高級軟件開發(fā)人員和從事該項技術(shù)的各個領(lǐng)域的科技工作者提供一本可讀性較好的參考書,有助于進一步推動我國的數(shù)據(jù)挖掘研究與應(yīng)用的深入開展。本書的編寫得到了中國工程院李德毅院士的關(guān)注和指導(dǎo),作者在此表示衷心的感謝。青島大學(xué)的隋毅、龐傳軍、紀俊、柯爽、楊坤等研究生也為本書的完成做了大量的工作,在此,一并表示衷心的感謝。在數(shù)據(jù)挖掘蓬勃發(fā)展的今天,該項技術(shù)涉及了很多學(xué)科領(lǐng)域,由于我們的理論水平和實踐經(jīng)驗都具有局限性,本書還存在不少不足之處,敬請讀者在閱讀本書時能夠給我們提出寶貴建議,并對相關(guān)內(nèi)容進行批評指正。

內(nèi)容概要

本書第一版是國內(nèi)第一本對數(shù)據(jù)挖掘技術(shù)基礎(chǔ)算法進行詳細描述的實用性教材。第二版在第一版基礎(chǔ)上進行了較多的修訂和補充。在系統(tǒng)闡述數(shù)據(jù)挖掘與知識發(fā)現(xiàn)技術(shù)的產(chǎn)生、發(fā)展,以及相關(guān)概念、原理、基本方法的基礎(chǔ)上,從實用的角度出發(fā),對數(shù)據(jù)挖掘中的關(guān)聯(lián)、分類、聚類、序列等算法和技術(shù)進行了剖析,對每種技術(shù)均提供了代表性算法。同時,結(jié)合作者近年來所做的研究,對數(shù)據(jù)挖掘的應(yīng)用問題進行了分類論述。最后,對目前數(shù)據(jù)挖掘的最新進展、應(yīng)用趨勢等進行了總結(jié)。    本書可作為計算機、管理等專業(yè)高年級本科生與研究生課程的教材,也可作為數(shù)據(jù)挖掘領(lǐng)域的高級軟件開發(fā)人員的參考書。

書籍目錄

第二版前言第一版前言第1章  導(dǎo)論  1.1  數(shù)據(jù)挖掘的社會需求  1.2  什么是數(shù)據(jù)挖掘  1.3  數(shù)據(jù)挖掘的數(shù)據(jù)來源  1.4  數(shù)據(jù)挖掘的分類    1.4.1  分類分析    1.4.2  聚類分析    1.4.3  關(guān)聯(lián)分析    1.4.4  序列分析及時問序列    1.4.5  孤立點分析    1.4.6  其他分析  1.5  數(shù)據(jù)挖掘的體系結(jié)構(gòu)與運行過程    1.5.1  數(shù)據(jù)挖掘的體系結(jié)構(gòu)    1.5.2  數(shù)據(jù)挖掘的步驟    1.5.3  實例    1.5.4  數(shù)據(jù)挖掘的過程模型    1.5.5  數(shù)據(jù)挖掘主要廠商和產(chǎn)品  1.6  數(shù)據(jù)挖掘與其他相關(guān)技術(shù)    1.6.1  數(shù)據(jù)挖掘與數(shù)據(jù)庫中知識發(fā)現(xiàn)    1.6.2  數(shù)據(jù)挖掘與聯(lián)機分析處理    1.6.3  數(shù)據(jù)挖掘與信息檢索    1.6.4  數(shù)據(jù)挖掘與機器學(xué)習(xí)    1.6.5  數(shù)據(jù)挖掘與數(shù)據(jù)融合    1.6.6  數(shù)據(jù)挖掘與統(tǒng)計學(xué)    1.6.7  數(shù)據(jù)挖掘與專家系統(tǒng)    1.6.8  數(shù)據(jù)挖掘與決策支持系統(tǒng)    1.6.9  數(shù)據(jù)挖掘與客戶關(guān)系管理    1.6.10  軟硬件發(fā)展對數(shù)據(jù)挖掘的影響    1.6.11  XML與面向Web的數(shù)據(jù)挖掘技術(shù)  1.7  數(shù)據(jù)挖掘工具的評價標準  1.8  數(shù)據(jù)挖掘的應(yīng)用  1.9  數(shù)據(jù)挖掘的要求及挑戰(zhàn)第2章 數(shù)據(jù)倉庫技術(shù)  2.1  數(shù)據(jù)倉庫概述    2.1.1 數(shù)據(jù)倉庫的定義    2.1.2 數(shù)據(jù)倉庫查詢系統(tǒng)    2.1.3  OLTP與OLAP      2.1.4 數(shù)據(jù)倉庫與數(shù)據(jù)集市    2.1.5 數(shù)據(jù)倉庫系統(tǒng)的結(jié)構(gòu)    2.1.6 數(shù)據(jù)倉庫中的元數(shù)據(jù)管理  2.2  數(shù)據(jù)倉庫的建模    2.2.1 星型模型    2.2.2 雪花模型    2.2.3 混合模型    2.2.4 多維數(shù)據(jù)模型  2.3 聯(lián)機分析處理    2.3.1  OLAP的功能及體系結(jié)構(gòu)    2.3.2  OLAP數(shù)據(jù)組織模型    2.3.3  OLAP的Web結(jié)構(gòu)    2.3.4  OLAP數(shù)據(jù)查詢機制  2.4  海威數(shù)據(jù)倉庫系統(tǒng)簡介    2.4.1 Highway Decision Center V1.0系統(tǒng)結(jié)構(gòu)    2.4.2 Highway Decision Center V2.0系統(tǒng)結(jié)構(gòu)    2.4.3 海威數(shù)據(jù)倉庫網(wǎng)絡(luò)結(jié)構(gòu)  2.5  數(shù)據(jù)倉庫應(yīng)用舉例    2.5.1 信用卡資信分析    2.5.2 貸款分析第3章 數(shù)據(jù)挖掘中的數(shù)據(jù)預(yù)處理  3.1 概論  3.2 數(shù)據(jù)預(yù)處理的基本步驟  3.3  數(shù)值屬性的離散化與特征選擇    3.3.1  Chi2算法簡介    3.3.2 舉例  …… 第4章  關(guān)聯(lián)規(guī)則第5章  數(shù)據(jù)分類第6章  聚類分析第7章  序列模式與時間序列第8章  空間多維數(shù)據(jù)訪問與可視化第9章  開放式的數(shù)據(jù)挖掘系統(tǒng)第10章  數(shù)據(jù)挖掘應(yīng)用第11章  數(shù)據(jù)挖掘新進展參考文獻

章節(jié)摘錄

插圖:第1章 導(dǎo)論1.1 數(shù)據(jù)挖掘的社會需求一切新事物的產(chǎn)生都是由需求驅(qū)動。讓計算機能夠自動、智能地分析數(shù)據(jù)庫中的大量數(shù)據(jù)以獲取信息是推動挖掘型工具產(chǎn)生并發(fā)展的強大動力。從生產(chǎn)成本的角度看,公司的人工費用在不斷提升,產(chǎn)品與服務(wù)的價格持續(xù)下降,激烈的市場競爭迫使決策者想辦法降低成本及擴大產(chǎn)品與服務(wù)的銷售量來提高公司的競爭力。從計算機應(yīng)用角度看,無論硬件與網(wǎng)絡(luò)性能的提高,還是軟件技術(shù)與功能的提高,都要求軟件從單純的管理功能向綜合的分析功能轉(zhuǎn)變。從數(shù)據(jù)管理角度看,歷史數(shù)據(jù)是一筆寶貴的財富,而且這些數(shù)據(jù)正以幾何級數(shù)或指數(shù)方式增長。從軟件技術(shù)發(fā)展方向看,海量數(shù)據(jù)的智能分析對原來各個領(lǐng)域的技術(shù)都帶來了極大的挑戰(zhàn),需要采用綜合性的技術(shù)來迎接這些挑戰(zhàn)。 隨著數(shù)據(jù)庫技術(shù)的飛速發(fā)展以及人們獲取數(shù)據(jù)手段的多樣化,人類所擁有的數(shù)據(jù)急劇增加,隨著大容量、高速度、低價格的存儲設(shè)備相繼問世,當今數(shù)據(jù)庫的容量越來越大,已經(jīng)達到TB(i),甚至PB的水平,但能夠?qū)@些數(shù)據(jù)進行有效分析處理的工具卻很少。數(shù)據(jù)庫系統(tǒng)往往只對已有數(shù)據(jù)進行存取和簡單操作,人們很難通過這些操作獲取數(shù)據(jù)隱含的深層語義,而這些描述數(shù)據(jù)整體特征和發(fā)展趨勢的信息在決策制定過程中具有更加重要的價值和意義,它們可以指導(dǎo)政府、企業(yè)決策以獲取更大的社會效益和經(jīng)濟效益。

編輯推薦

《數(shù)據(jù)挖掘原理與算法(第2版)》由科學(xué)出版社出版。

圖書封面

圖書標簽Tags

評論、評分、閱讀與下載


    數(shù)據(jù)挖掘原理與算法 PDF格式下載


用戶評論 (總計6條)

 
 

  •   數(shù)據(jù)挖掘原理與算法值得擁有。
  •   本書內(nèi)容全面、詳細,既有理論,又有實際應(yīng)用。是數(shù)據(jù)挖掘方面一本很好的教材
  •   墮入了凡塵
  •   書不錯!正是我想要的!
  •   紙張不錯,看著非常舒服
  •   書紙質(zhì)量很好,
 

250萬本中文圖書簡介、評論、評分,PDF格式免費下載。 第一圖書網(wǎng) 手機版

京ICP備13047387號-7