出版時間:2009-1 出版社:水利水電出版社 作者:譚建豪 等編著 頁數(shù):285
Tag標(biāo)簽:無
前言
數(shù)據(jù)挖掘是一門綜合性學(xué)科,借鑒了多門學(xué)科的概念、理論、方法和技術(shù)。這些學(xué)科包括數(shù)據(jù)庫系統(tǒng)、專家系統(tǒng)、機(jī)器學(xué)習(xí)、統(tǒng)計學(xué)、模式識別、信息檢索、人工神經(jīng)網(wǎng)絡(luò)(正文中簡稱神經(jīng)網(wǎng)絡(luò))、支持向量機(jī)、遺傳算法、模糊優(yōu)化、高性能計算和數(shù)據(jù)可視化等。數(shù)據(jù)挖掘旨在發(fā)現(xiàn)隱藏在大型數(shù)據(jù)集中的知識模式,其基本問題是可行性、實用性、有效性和可伸縮性問題?! ?shù)據(jù)挖掘出現(xiàn)于20世紀(jì)80年代后期,隨著國內(nèi)外研究的深入,已經(jīng)取得了一批有價值的成果,并展現(xiàn)出良好的發(fā)展勢頭。本書較系統(tǒng)地闡述了該領(lǐng)域目前的研究狀況,介紹了幾種典型的數(shù)據(jù)挖掘技術(shù)和系統(tǒng),并討論了數(shù)據(jù)挖掘的應(yīng)用情況和研究方向。 與數(shù)據(jù)挖掘有關(guān)的一些書籍主要是關(guān)于數(shù)據(jù)庫方面的。隨著大規(guī)模數(shù)據(jù)庫(或信息庫)的廣泛應(yīng)用,人們已不滿足于僅對數(shù)據(jù)或信息進(jìn)行查詢和檢索,因為簡單的查詢和檢索一般不能使用戶直接獲得帶有結(jié)論性的信息。因此僅僅依靠查詢和檢索的手段,數(shù)據(jù)庫蘊(yùn)藏的知識是得不到充分發(fā)掘和利用的?! ×硗?,人工智能、專家系統(tǒng)和機(jī)器學(xué)習(xí)方面的書籍對數(shù)據(jù)挖掘也有所論述。研究雖然取得了一定的進(jìn)展,但是知識獲取仍然是瓶頸問題,知識工程師從專家那里獲取知識的方式仍然帶有很強(qiáng)的個體性和隨機(jī)性,沒有統(tǒng)一的方法?! ≈R發(fā)現(xiàn)與數(shù)據(jù)挖掘是一門新的技術(shù)學(xué)科,其理論框架與技術(shù)原理尚處于研究的初級階段,還沒有形成完整的理論體系。盡管如此,僅從已有的研究成果看,也足以展示其廣闊的研究領(lǐng)域和應(yīng)用前景。本書擬在闡述知識發(fā)現(xiàn)與數(shù)據(jù)挖掘原理的基礎(chǔ)上,探索將其用于復(fù)雜工業(yè)系統(tǒng)的原理、方法和技術(shù)?! ∧壳?,許多學(xué)校正在對傳統(tǒng)的教學(xué)內(nèi)容進(jìn)行改革,自動化、電子信息、測控技術(shù)與儀表、電氣工程、系統(tǒng)工程、機(jī)電工程等專業(yè)迫切需要較多與信息相關(guān)的知識。由于這些專業(yè)的學(xué)生在本科階段已較為扎實地掌握了數(shù)據(jù)庫系統(tǒng)的知識,在研究生階段便轉(zhuǎn)入人工智能理論與技術(shù)的學(xué)習(xí)。如何將數(shù)據(jù)挖掘技術(shù)及人工智能理論在一個大的框架內(nèi)以統(tǒng)一的視角用于解決工程實際問題,是本書著力的方向。 本教材是為電子信息及相關(guān)專業(yè)編寫的。作為一門技術(shù)基礎(chǔ)課,它以“數(shù)據(jù)庫技術(shù)”及“人工智能”課程為先修課。既要學(xué)時少,又要讓學(xué)生對數(shù)據(jù)挖掘原理及其在復(fù)雜工業(yè)系統(tǒng)中的應(yīng)用建立較全面的印象,同時還應(yīng)該使學(xué)生學(xué)有所用,并為今后的發(fā)展打下基礎(chǔ),這是本書編寫的指導(dǎo)思想。編者力求避免本書與先修課程內(nèi)容重復(fù),對書中必不可少的相關(guān)知識只作簡單介紹。
內(nèi)容概要
本書較為系統(tǒng)地介紹了數(shù)據(jù)挖掘的基本概念、基本方法和基本技術(shù)以及數(shù)據(jù)挖掘的最新進(jìn)展,并以較大篇幅敘述了數(shù)據(jù)挖掘在復(fù)雜工業(yè)系統(tǒng)中的應(yīng)用情況。 本書深入而系統(tǒng)地闡述了數(shù)據(jù)挖掘的研究歷史和現(xiàn)狀、數(shù)據(jù)挖掘與數(shù)理統(tǒng)計的關(guān)系、數(shù)據(jù)挖掘技術(shù)(包括語義網(wǎng)絡(luò)、智能體、分類、預(yù)測、復(fù)雜類型數(shù)據(jù)等基礎(chǔ)概念和技術(shù))、數(shù)據(jù)庫系統(tǒng)及專家系統(tǒng)中的數(shù)據(jù)挖掘方式、數(shù)據(jù)挖掘的應(yīng)用及一些具有挑戰(zhàn)性的研究課題,對每類問題均提供了代表性算法和具體應(yīng)用法則。全書共分7章,主要內(nèi)容包括數(shù)據(jù)挖掘綜述、從數(shù)理統(tǒng)計到數(shù)據(jù)挖掘、語義網(wǎng)絡(luò)挖掘及其應(yīng)用、智能體挖掘及其應(yīng)用、分類挖掘及其應(yīng)用、預(yù)測挖掘及其應(yīng)用和復(fù)雜類型數(shù)據(jù)挖掘及其應(yīng)用。 本書可作為高等院校自動化、電子信息、測控技術(shù)與儀表、電氣工程、系統(tǒng)工程、機(jī)電工程等專業(yè)的本科生和研究生教材,也可作為相關(guān)專業(yè)工程技術(shù)人員的自學(xué)參考書。
書籍目錄
前言第1章 數(shù)據(jù)挖掘綜述 1.1 數(shù)據(jù)挖掘的研究歷史和現(xiàn)狀 1.2 數(shù)據(jù)挖掘定義 1.2.1 技術(shù)角度的定義 1.2.2 商業(yè)角度的定義 1.2.3 數(shù)據(jù)挖掘與傳統(tǒng)分析方法的區(qū)別 1.2.4 數(shù)據(jù)挖掘和數(shù)據(jù)倉庫 1.2.5 數(shù)據(jù)挖掘和在線分析處理 1.2.6 數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和統(tǒng)計 1.2.7 軟硬件發(fā)展對數(shù)據(jù)挖掘的影響 1.3 數(shù)據(jù)挖掘研究內(nèi)容 1.3.1 數(shù)據(jù)挖掘所發(fā)現(xiàn)的知識 1.3.2 數(shù)據(jù)挖掘的功能 1.3.3 數(shù)據(jù)挖掘常用技術(shù) 1.3.4 數(shù)據(jù)挖掘中的數(shù)據(jù)倉庫 1.4 數(shù)據(jù)挖掘系統(tǒng)工作原理 1.4.1 數(shù)據(jù)挖掘系統(tǒng)結(jié)構(gòu) 1.4.2 數(shù)據(jù)挖掘流程 1.5 小結(jié) 習(xí)題1第2章 從數(shù)理統(tǒng)計到數(shù)據(jù)挖掘 2.1 數(shù)理統(tǒng)計與數(shù)據(jù)挖掘的關(guān)系 2.1.1 數(shù)理統(tǒng)計的性質(zhì) 2.1.2 數(shù)據(jù)挖掘的性質(zhì) 2.1.3 從數(shù)理統(tǒng)計到數(shù)據(jù)挖掘 2.2 數(shù)理統(tǒng)計與數(shù)據(jù)庫技術(shù)的結(jié)合 2.3 回歸分析的基本概念 2.4 線性回歸方程 2.5 線性相關(guān)的顯著性檢驗 2.5.1 線性回歸的方差分析 2.5.2 相關(guān)系數(shù)的顯著性檢驗 2.6 非線性回歸分析 2.6.1 化非線性回歸為線性回歸 2.6.2 多項式回歸 2.7 多元線性回歸分析 2.7.1 多元線性回歸方程 2.7.2 多元線性回歸的方差分析 2.8 一般情況下的回歸分析 2.8.1 一般情況下的回歸方程 2.8.2 一般情況下的參數(shù)估計 2.9 逐步回歸分析的軟件設(shè)計 2.10 鍛模設(shè)計準(zhǔn)則的制定 2.10.1 研究的內(nèi)容 2.10.2 資料收集與數(shù)據(jù)處理 2.10.3 飛邊尺寸設(shè)計準(zhǔn)則的制定 2.10.4 飛邊金屬消耗設(shè)計準(zhǔn)則的制定 2.11 小結(jié) 習(xí)題2第3章 語義網(wǎng)絡(luò)挖掘及其應(yīng)用 3.1 語義網(wǎng)絡(luò)概念 3.1.1 概述 3.1.2 知識的表示 3.1.3 搜索原理 3.1.4 語義網(wǎng)絡(luò)及其特性 3.1.5 語義網(wǎng)絡(luò)的推理及其特點 3.2 語義網(wǎng)絡(luò)挖掘原理 3.2.1 概述 3.2.2 歸納學(xué)習(xí)中的實例學(xué)習(xí) 3.2.3 類比學(xué)習(xí) 3.3 基于AutoCAD的注塑模架設(shè)計專家系統(tǒng) 3.3.1 注塑模架設(shè)計專家系統(tǒng)總體方案設(shè)計 3.3.2 模架設(shè)計專家系統(tǒng)的組成 3.3.3 系統(tǒng)模架生成模塊的設(shè)計 3.3.4 系統(tǒng)數(shù)據(jù)庫模塊的設(shè)計 3.3.5 注塑模架CAD設(shè)計系統(tǒng)的實現(xiàn) 3.4 小結(jié) 習(xí)題3 第4章 智能體挖掘及其應(yīng)用 4.1 智能體概念 4.1.1 概述 4.1.2 分布式問題求解 4.1.3 面向?qū)ο蟊硎痉ā ?章 分類挖掘及其應(yīng)用第6章 預(yù)測挖掘及其應(yīng)用第7章 復(fù)雜類型數(shù)據(jù)挖掘及其應(yīng)用參考文獻(xiàn)
章節(jié)摘錄
第1章 數(shù)據(jù)挖掘綜述 1.1 數(shù)據(jù)挖掘的研究歷史和現(xiàn)狀 數(shù)據(jù)挖掘其實是一個逐漸演變的過程。電子數(shù)據(jù)處理的初期,人們就試圖通過某些方法來實現(xiàn)自動決策支持,當(dāng)時機(jī)器學(xué)習(xí)成為人們關(guān)心的焦點。機(jī)器學(xué)習(xí)的過程就是將一些已知的并已被成功解決的問題作為范例輸入計算機(jī),機(jī)器通過學(xué)習(xí)這些范例總結(jié)并生成相應(yīng)的規(guī)則,這些規(guī)則具有通用性,使用它們可以解決某一類的問題。隨后,隨著人工神經(jīng)網(wǎng)絡(luò)(以下簡稱神經(jīng)網(wǎng)絡(luò))技術(shù)的形成和發(fā)展,人們的注意力轉(zhuǎn)向知識工程。知識工程不同于機(jī)器學(xué)習(xí),它是直接給計算機(jī)輸入已被代碼化的規(guī)則,而計算機(jī)是通過使用這些規(guī)則來解決某些問題。專家系統(tǒng)就是用這種方法所得到的成果,但它有投資大、效果不甚理想等不足。20世紀(jì)80年代,人們又在新的神經(jīng)網(wǎng)絡(luò)理論的指導(dǎo)下,重新回到機(jī)器學(xué)習(xí)的方法上,并將其成果應(yīng)用于處理大型商業(yè)數(shù)據(jù)庫?! ‰S著數(shù)據(jù)庫技術(shù)的不斷發(fā)展及數(shù)據(jù)庫管理系統(tǒng)的廣泛應(yīng)用,數(shù)據(jù)庫中存儲的數(shù)據(jù)量急劇增大,在大量的數(shù)據(jù)背后隱藏著許多重要的信息,如果能把這些信息從數(shù)據(jù)庫中抽取出來,將為公司創(chuàng)造很多潛在的利潤,數(shù)據(jù)挖掘概念就是從這樣的商業(yè)角度開發(fā)出來的。 數(shù)據(jù)倉庫技術(shù)的發(fā)展與數(shù)據(jù)挖掘有著密切的關(guān)系。數(shù)據(jù)倉庫的發(fā)展是推動數(shù)據(jù)挖掘技術(shù)發(fā)展的原因之一。但是,數(shù)據(jù)倉庫并不是數(shù)據(jù)挖掘的先決條件,因為有很多數(shù)據(jù)挖掘可直接從操作數(shù)據(jù)源中挖掘信息?! 〈_切地說,數(shù)據(jù)挖掘(Data Mining),又稱數(shù)據(jù)庫中的知識發(fā)現(xiàn)(Knowledge Discovery in Database—KDD),是指從大型數(shù)據(jù)庫或數(shù)據(jù)倉庫中提取隱含的、未知的、非平凡的及有潛在應(yīng)用價值的信息或模式,它是數(shù)據(jù)庫研究中的一個很有應(yīng)用價值的新領(lǐng)域,融合了數(shù)據(jù)庫、人工智能、機(jī)器學(xué)習(xí)、統(tǒng)計學(xué)等多個領(lǐng)域的理論和技術(shù)。
編輯推薦
《數(shù)據(jù)挖掘技術(shù)》特色: 系統(tǒng)闡述數(shù)據(jù)挖掘基礎(chǔ)理論、基本方法和成熟技術(shù),著眼熱點、難點、疑點問題,把握未來發(fā)展趨勢;將數(shù)據(jù)挖掘技術(shù)與人工智能理論統(tǒng)一在一個大的框架內(nèi);知識點環(huán)環(huán)相扣,形成循序漸進(jìn)的知識鏈,精選相應(yīng)實例,供讀者加深理解;配有多種類型習(xí)題100多道,供讀者練習(xí)與自測;提供教學(xué)相關(guān)資源(電子教案、教學(xué)網(wǎng)站等);既可作為高年級本科生、研究生教材,又可作為科研和工程技術(shù)人員參考資料。
圖書封面
圖書標(biāo)簽Tags
無
評論、評分、閱讀與下載