出版時(shí)間:2013-2 出版社:電子工業(yè)出版社 作者:蔣盛益 頁(yè)數(shù):284
Tag標(biāo)簽:無(wú)
內(nèi)容概要
《高等學(xué)校計(jì)算機(jī)規(guī)劃教材:數(shù)據(jù)挖掘原理與實(shí)踐》分為數(shù)據(jù)挖掘理論和數(shù)據(jù)挖掘?qū)嵺`兩大部分?;A(chǔ)理論部分的主要內(nèi)容包括數(shù)據(jù)挖掘的基本概念、數(shù)據(jù)挖掘的預(yù)處理、聚類(lèi)分析、分類(lèi)與回歸、關(guān)聯(lián)規(guī)則挖掘、例外點(diǎn)檢測(cè)。數(shù)據(jù)挖掘?qū)嵺`部分討論了數(shù)據(jù)挖掘在通信行業(yè)、文本挖掘等方面的實(shí)際應(yīng)用;通過(guò)四個(gè)案例展示了在通信行業(yè)中如何利用數(shù)據(jù)挖掘進(jìn)行客戶細(xì)分、客戶流失分析、客戶社會(huì)關(guān)系挖掘、業(yè)務(wù)交叉銷(xiāo)售;通過(guò)跨語(yǔ)言智能學(xué)術(shù)搜索系統(tǒng)和基于內(nèi)容的垃圾郵件識(shí)別兩個(gè)案例展示了數(shù)據(jù)挖掘在文本挖掘方面的應(yīng)用?! 陡叩葘W(xué)校計(jì)算機(jī)規(guī)劃教材:數(shù)據(jù)挖掘原理與實(shí)踐》可作為高等院校計(jì)算機(jī)電子商務(wù)及相關(guān)專(zhuān)業(yè)的學(xué)生相關(guān)的教材或參考書(shū),也可供從事數(shù)據(jù)挖掘研究、設(shè)計(jì)等工作的科研、技術(shù)人員參考。
書(shū)籍目錄
上篇 理論篇第1章 緒 論 1.1 數(shù)據(jù)挖掘產(chǎn)生的背景 1.2 數(shù)據(jù)挖掘任務(wù)及過(guò)程 1.2.1 數(shù)據(jù)挖掘定義 1.2.2 數(shù)據(jù)挖掘?qū)ο?1.2.3 數(shù)據(jù)挖掘任務(wù) 1.2.4 數(shù)據(jù)挖掘過(guò)程 1.2.5 數(shù)據(jù)挖掘常用軟件簡(jiǎn)介 1.3 數(shù)據(jù)挖掘應(yīng)用 1.3.1 數(shù)據(jù)挖掘在商業(yè)領(lǐng)域中的應(yīng)用 1.3.2 數(shù)據(jù)挖掘在計(jì)算機(jī)領(lǐng)域中的應(yīng)用 1.3.3 其他領(lǐng)域中的應(yīng)用 1.4 數(shù)據(jù)挖掘技術(shù)的前景、研究熱點(diǎn) 1.4.1 數(shù)據(jù)挖掘技術(shù)的價(jià)值和前景 1.4.2 數(shù)據(jù)挖掘的研究熱點(diǎn) 1.4.3 數(shù)據(jù)挖掘的未來(lái)發(fā)展 本章小結(jié) 習(xí)題1 第2章 數(shù)據(jù)處理基礎(chǔ) 2.1 數(shù)據(jù) 2.1.1 數(shù)據(jù)及數(shù)據(jù)類(lèi)型 2.1.2 數(shù)據(jù)集的類(lèi)型 2.2 數(shù)據(jù)統(tǒng)計(jì)特性 2.2.1 數(shù)據(jù)的中心度量 2.2.2 數(shù)據(jù)散布程度度量 2.3 數(shù)據(jù)預(yù)處理 2.3.1 數(shù)據(jù)清理 2.3.2 數(shù)據(jù)聚合 2.3.3 數(shù)據(jù)變換 2.3.4 數(shù)據(jù)歸約 2.4 相似性度量 2.4.1 屬性之間的相似性度量 2.4.2 對(duì)象之間的相似性度量 2.5 本章小結(jié) 習(xí)題2 第3章 分類(lèi)與回歸 3.1 概述 3.2 決策樹(shù)分類(lèi)方法 3.2.1 決策樹(shù)的基本概念 3.2.2 決策樹(shù)的構(gòu)建 3.2.3 ID3分類(lèi)算法 3.2.4 C4.5分類(lèi)算法 3.2.5 CART算法 3.3 貝葉斯分類(lèi)方法 3.3.1 貝葉斯定理 3.3.2 樸素貝葉斯分類(lèi)算法 3.4 K-最近鄰分類(lèi)方法 3.4.1 K-最近鄰分類(lèi)算法基本概念 3.4.2 K-最近鄰分類(lèi)算法描述 3.4.3 k-最近鄰分類(lèi)算法的優(yōu)缺點(diǎn) 3.5 神經(jīng)網(wǎng)絡(luò)分類(lèi)方法 3.5.1 人工神經(jīng)網(wǎng)絡(luò)的基本概念 3.5.2 典型神經(jīng)網(wǎng)絡(luò)模型介紹 3.5.3 神經(jīng)網(wǎng)絡(luò)的優(yōu)缺點(diǎn) 3.6 支持向量機(jī) 3.7 集成學(xué)習(xí)法 3.8 不平衡類(lèi)問(wèn)題 3.9 分類(lèi)模型的評(píng)價(jià) 3.9.1 分類(lèi)模型性能評(píng)價(jià)指標(biāo) 3.9.2 分類(lèi)模型的過(guò)分?jǐn)M合 3.9.3 評(píng)估分類(lèi)模型性能的方法 3.10 回歸 3.10.1 線性回歸 3.10.2 非線性回歸 3.10.3 邏輯回歸 3.11 本章小結(jié) 習(xí)題3 第4章 聚類(lèi)分析 4.1 概述 4.1.1 聚類(lèi)分析研究的主要內(nèi)容 4.1.2 數(shù)據(jù)挖掘?qū)垲?lèi)算法的要求 4.1.3 典型聚類(lèi)方法簡(jiǎn)介 4.2 基于劃分的聚類(lèi)算法 4.2.1 基本k-means聚類(lèi)算法 4.2.2 二分k-means算法 4.2.3 k-means聚類(lèi)算法的拓展 4.2.4 k-medoids算法 4.3 層次聚類(lèi)算法 4.3.1 BIRCH算法 4.3.2 CURE算法 4.3.3 ROCK算法 4.4 基于密度的聚類(lèi)算法 4.5 基于圖的聚類(lèi)算法 4.5.1 Chameleon聚類(lèi)算法 4.5.2 基于SNN的聚類(lèi)算法 4.6 一趟聚類(lèi)算法 4.6.1 算法描述 4.6.2 聚類(lèi)閾值的選擇策略 4.7 基于模型的聚類(lèi)算法 4.7.1 期望最大化方法EM 4.7.2 概念聚類(lèi) 4.7.3 SOM方法 4.8 聚類(lèi)算法評(píng)價(jià) 本章小結(jié) 習(xí)題4 第5章 關(guān)聯(lián)分析 5.1 概述 5.2 頻繁項(xiàng)集發(fā)現(xiàn)算法 5.2.1 Apriori 算法 5.2.2 Fp-growth算法 5.3 關(guān)聯(lián)規(guī)則的生成 5.4 非二元屬性的關(guān)聯(lián)規(guī)則挖掘 5.5 關(guān)聯(lián)規(guī)則的評(píng)價(jià) 5.5.1 支持度和置信度 5.5.2 相關(guān)性分析 5.5.3 辛普森悖論 5.6 序列模式 5.6.1 問(wèn)題描述 5.6.2 序列模式發(fā)現(xiàn)算法 5.7 本章小結(jié) 習(xí)題 第6章 離群點(diǎn)挖掘 6.1 概述 6.2 基于統(tǒng)計(jì)的方法 6.3 基于距離的方法 6.4 基于相對(duì)密度的方法 6.5 基于聚類(lèi)的方法 6.5.1 基于對(duì)象離群因子的方法 6.5.2 基于簇的離群因子方法 6.5.3 基于聚類(lèi)的動(dòng)態(tài)數(shù)據(jù)離群點(diǎn)檢測(cè) 6.6 離群點(diǎn)挖掘方法的評(píng)估 6.7 本章小結(jié) 習(xí)題 下篇 實(shí)踐篇第7章 數(shù)據(jù)挖掘在電信業(yè)中的應(yīng)用 7.1 數(shù)據(jù)挖掘在電信業(yè)的應(yīng)用概述 7.1.1 客戶細(xì)分 7.1.2 客戶流失預(yù)測(cè)分析 7.1.3 客戶社會(huì)關(guān)系挖掘 7.1.4 業(yè)務(wù)交叉銷(xiāo)售 7.1.5 欺詐客戶識(shí)別 7.2 案例一: 客戶通話模式分析 7.2.1 概述 7.2.2 數(shù)據(jù)描述 7.2.3 數(shù)據(jù)預(yù)處理 7.2.4 發(fā)現(xiàn)之旅 7.3 案例二:基于通話數(shù)據(jù)的社會(huì)網(wǎng)絡(luò)分析 7.3.1 概述 7.3.2 客戶呼叫圖的構(gòu)建 7.3.3 客戶呼叫圖的一般屬性及其應(yīng)用 7.3.4 客戶呼叫圖的社區(qū)發(fā)現(xiàn)及應(yīng)用 7.4 案例三:客戶細(xì)分與流失分析 7.4.1 概述 7.4.2 數(shù)據(jù)準(zhǔn)備 7.4.3 數(shù)據(jù)預(yù)處理 7.4.4 客戶聚類(lèi)分析 7.4.5 建立分類(lèi)預(yù)測(cè)模型 7.4.6 模型評(píng)估與調(diào)整優(yōu)化 7.5 案例四:移動(dòng)業(yè)務(wù)關(guān)聯(lián)分析 7.5.1 概述 7.5.2 數(shù)據(jù)準(zhǔn)備 7.5.3 數(shù)據(jù)預(yù)處理 7.5.4 關(guān)聯(lián)規(guī)則挖掘過(guò)程 7.5.5 規(guī)則的優(yōu)化 7.5.5 模型的應(yīng)用 7.6 本章小結(jié) 第8章 文本挖掘與Web數(shù)據(jù)挖掘 8.1 文本挖掘 8.1.1 分詞 8.1.2 文本表示與詞權(quán)重計(jì)算 8.1.3 文本特征選擇 8.1.4 文本分類(lèi) 8.1.5 文本聚類(lèi) 8.1.6 文檔自動(dòng)摘要 8.2 Web數(shù)據(jù)挖掘 8.2.1 Web內(nèi)容挖掘 8.2.2 Web使用挖掘 8.2.3 Web結(jié)構(gòu)挖掘 8.3 案例五——跨語(yǔ)言智能學(xué)術(shù)搜索系統(tǒng) 8.3.1 混合語(yǔ)種文本分詞 8.3.2 基于機(jī)器翻譯的跨語(yǔ)言信息檢索 8.3.3 不同語(yǔ)種文本的搜索結(jié)果聚類(lèi) 8.3.4 基于聚類(lèi)的個(gè)性化信息檢索 8.3.5 基于聚類(lèi)的查詢擴(kuò)展 8.3.6 其他檢索便利工具 8.3.7 系統(tǒng)性能評(píng)估 8.4 案例六——基于內(nèi)容的垃圾郵件識(shí)別 8.4.1 垃圾郵件識(shí)別方法簡(jiǎn)介 8.4.2 基于內(nèi)容的垃圾郵件識(shí)別方法工作原理 8.4.3 一種基于聚類(lèi)的垃圾郵件識(shí)別方法 8.5 本章小結(jié) 參考文獻(xiàn)
章節(jié)摘錄
版權(quán)頁(yè):插圖:客戶信用風(fēng)險(xiǎn)分析和欺詐行為預(yù)測(cè)對(duì)企業(yè)的財(cái)務(wù)安全非常重要,利用數(shù)據(jù)挖掘中的關(guān)聯(lián)分析、離群點(diǎn)檢測(cè)技術(shù)對(duì)企業(yè)經(jīng)營(yíng)管理數(shù)據(jù)進(jìn)行分析,如何預(yù)測(cè)可能將發(fā)生的風(fēng)險(xiǎn)?判定哪些因素會(huì)導(dǎo)致風(fēng)險(xiǎn)?這些風(fēng)險(xiǎn)主要來(lái)自于何處?通過(guò)準(zhǔn)確、及時(shí)地對(duì)各種信用風(fēng)險(xiǎn)進(jìn)行監(jiān)視、評(píng)價(jià)、預(yù)警和管理,評(píng)價(jià)這些風(fēng)險(xiǎn)的嚴(yán)重性、發(fā)生的可能性及控制這些風(fēng)險(xiǎn)的成本,進(jìn)而采取有效的規(guī)避和監(jiān)督措施,在信用風(fēng)險(xiǎn)發(fā)生之前對(duì)其進(jìn)行預(yù)警和控制,趨利避害,防范信用風(fēng)險(xiǎn)。(3)市場(chǎng)分析和管理數(shù)據(jù)挖掘技術(shù)可以用于市場(chǎng)營(yíng)銷(xiāo),其基本假定是“消費(fèi)者過(guò)去的行為是其今后消費(fèi)傾向的最好說(shuō)明”,通過(guò)收集、加工和處理,能夠反映消費(fèi)者消費(fèi)行為的大量信息,來(lái)確定特定消費(fèi)群體或個(gè)體的興趣、消費(fèi)習(xí)慣、消費(fèi)傾向和消費(fèi)需求,進(jìn)而推斷出相應(yīng)消費(fèi)群體或個(gè)體下一步的消費(fèi)行為,然后以此為基礎(chǔ),對(duì)識(shí)別出的消費(fèi)群體進(jìn)行特定內(nèi)容的定向營(yíng)銷(xiāo)。這與傳統(tǒng)的不區(qū)分消費(fèi)對(duì)象特征的大規(guī)模營(yíng)銷(xiāo)手段相比,大大節(jié)省了營(yíng)銷(xiāo)成本,提高了營(yíng)銷(xiāo)效果,從而為企業(yè)帶來(lái)更多的利潤(rùn)。商業(yè)消費(fèi)信息來(lái)自市場(chǎng)中的各種渠道。例如,當(dāng)客戶使用信用卡消費(fèi)時(shí),商業(yè)企業(yè)就可以在信用卡結(jié)算過(guò)程中收集商業(yè)消費(fèi)信息,記錄下客戶消費(fèi)的時(shí)間、地點(diǎn)、感興趣的商品或服務(wù)、愿意接收的價(jià)格水平和支付能力等數(shù)據(jù);當(dāng)客戶在申辦信用卡、辦理駕駛執(zhí)照、填寫(xiě)商品保修單等其他需要填寫(xiě)表格的場(chǎng)合時(shí),客戶的個(gè)人信息就存入了相應(yīng)的業(yè)務(wù)數(shù)據(jù)庫(kù)。企業(yè)除了自行收集相關(guān)業(yè)務(wù)信息之外,還可以從其他公司或機(jī)構(gòu)購(gòu)買(mǎi)此類(lèi)信息為己所用。這些來(lái)自各種渠道的數(shù)據(jù)信息通過(guò)融合,商家可以挖掘出能夠用于向特定消費(fèi)群體或個(gè)體進(jìn)行定向營(yíng)銷(xiāo)的決策信息。在市場(chǎng)經(jīng)濟(jì)比較發(fā)達(dá)的國(guó)家和地區(qū),許多公司都開(kāi)始在原有信息系統(tǒng)的基礎(chǔ)上通過(guò)數(shù)據(jù)挖掘?qū)I(yè)務(wù)信息進(jìn)行深度加工,以構(gòu)筑自己的競(jìng)爭(zhēng)優(yōu)勢(shì),擴(kuò)大自己的市場(chǎng)份額?;跀?shù)據(jù)挖掘的營(yíng)銷(xiāo)對(duì)我國(guó)當(dāng)前的市場(chǎng)競(jìng)爭(zhēng)具有啟發(fā)意義,我們經(jīng)常看到繁華商業(yè)街上一些廠商對(duì)來(lái)往行人不分對(duì)象地散發(fā)大量商品宣傳廣告,其結(jié)果是不需要的人隨手丟棄資料,而需要的人并不一定能夠輕松得到。如果家電維修服務(wù)公司向在商店中剛剛購(gòu)買(mǎi)家電的消費(fèi)者郵寄維修服務(wù)廣告,藥品廠商向醫(yī)院特定門(mén)診就醫(yī)的病人郵寄廣告,那么其營(yíng)銷(xiāo)效果肯定會(huì)比漫無(wú)目的的營(yíng)銷(xiāo)效果要好很多。(4)企業(yè)危機(jī)管理危機(jī)管理是管理領(lǐng)域新出現(xiàn)的研究熱點(diǎn),是以市場(chǎng)競(jìng)爭(zhēng)中危機(jī)的出現(xiàn)為研究起點(diǎn),分析企業(yè)危機(jī)產(chǎn)生的原因和過(guò)程,研究企業(yè)預(yù)防危機(jī)、應(yīng)付危機(jī)、解決危機(jī)的手段和策略,以增強(qiáng)企業(yè)的免疫力、應(yīng)變力和競(jìng)爭(zhēng)力,使管理者能夠及時(shí)、準(zhǔn)確地獲取所需要的信息,迅速捕捉到企業(yè)可能發(fā)生危機(jī)的一切可能事件和先兆,進(jìn)而采取有效的規(guī)避措施。在危機(jī)發(fā)生之前對(duì)其進(jìn)行控制,趨利避害,從而使企業(yè)能夠適應(yīng)迅速變化的市場(chǎng)環(huán)境,保持長(zhǎng)久的競(jìng)爭(zhēng)優(yōu)勢(shì)。但是由于危機(jī)產(chǎn)生的原因復(fù)雜,種類(lèi)繁多,許多因素難以量化,很多因素由于沒(méi)有歷史數(shù)據(jù)和相應(yīng)的統(tǒng)計(jì)資料,很難進(jìn)行科學(xué)的計(jì)算和評(píng)估。數(shù)據(jù)挖掘技術(shù)在危機(jī)識(shí)別、分析和控制等方面都可以發(fā)揮作用。
編輯推薦
《數(shù)據(jù)挖掘原理與實(shí)踐》是高等學(xué)校計(jì)算機(jī)規(guī)劃教材之一。
圖書(shū)封面
圖書(shū)標(biāo)簽Tags
無(wú)
評(píng)論、評(píng)分、閱讀與下載
數(shù)據(jù)挖掘原理與實(shí)踐 PDF格式下載
250萬(wàn)本中文圖書(shū)簡(jiǎn)介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書(shū)網(wǎng) 手機(jī)版