出版時間:2012-7 出版社:經(jīng)濟科學(xué)出版社 作者:王暉,王琪,何瓊 著 頁數(shù):231 字數(shù):200000
內(nèi)容概要
《數(shù)據(jù)挖掘理論與實例》編著者王暉、王琪何瓊。
《數(shù)據(jù)挖掘理論與實例》的主要內(nèi)容包括理論和實例兩部分:第一、第二章介紹數(shù)據(jù)挖掘、數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的常用技術(shù)等基本理論;實例部分是以作者的兩個研究課題為基礎(chǔ),第三、第四章介紹呼叫中心數(shù)據(jù)倉庫的構(gòu)建和數(shù)據(jù)挖掘模型與實現(xiàn)(MS
SQL Server
2000、決策樹);第五、第六章介紹數(shù)據(jù)挖掘在QFII投資理念與持股偏好研究中的應(yīng)用(Rsoftware、MySQL、多元逐步線性回歸、因子分析、聚類分析等)。
書籍目錄
第一章 緒論
第一節(jié) 什么是數(shù)據(jù)挖掘
第二節(jié) 基本數(shù)據(jù)挖掘任務(wù)
第三節(jié) 數(shù)據(jù)挖掘的過程
第四節(jié) 數(shù)據(jù)倉庫與OLAP技術(shù)概述
第五節(jié) 數(shù)據(jù)挖掘技術(shù)的發(fā)展
第二章 數(shù)據(jù)挖掘工具
第一節(jié) 數(shù)據(jù)挖掘的統(tǒng)計方法
第二節(jié) 聚類分析
第三節(jié) 決策樹
第四節(jié) 相關(guān)軟件
第三章 呼叫中心中數(shù)據(jù)倉庫的構(gòu)建
第一節(jié) 數(shù)據(jù)倉庫構(gòu)建的實施方法及步驟
第二節(jié) 呼叫中心數(shù)據(jù)倉庫模型設(shè)計
第三節(jié) 數(shù)據(jù)倉庫生成
第四章 呼叫中心中的數(shù)據(jù)挖掘模型與實現(xiàn)
第一節(jié) 問題鑒別
第二節(jié) 解決方案
第三節(jié) 基于決策樹的分類算法模型
第四節(jié) C4.5算法構(gòu)造信息需求分類和客戶細分決策樹實例
第五節(jié) 功能模塊的實現(xiàn)
第六節(jié) 系統(tǒng)應(yīng)用示例
第五章 QFII投資理念與持股偏好研究中數(shù)據(jù)收集與整理
第一節(jié) 外國機構(gòu)投資者投資理念及持股偏好概述
第二節(jié) QFII重倉股數(shù)據(jù)來源
第三節(jié) 因變量的選取
第四節(jié) 自變量的選取
第六章 QFII投資理念與持股偏好研究中數(shù)據(jù)挖掘模型與實現(xiàn)
第一節(jié) 重倉股家數(shù)變化趨勢和行業(yè)分布
第二節(jié) 重倉股持有時間特征
第三節(jié) 描述性統(tǒng)計分析
第四節(jié) 相關(guān)性分析
第五節(jié) 持股偏好多元線性逐步回歸分析
參考文獻
附表
附表1 12家QFII基本情況及最新額度
附表2 瑞士銀行的名稱
附表3 12家QFII持有股票家數(shù)和行業(yè)情況匯總
附表4 各季度因變量和自變量的均值及樣本個數(shù)
附表5 各季度因變量和自變量的方差及樣本個數(shù)
附表6 2008年12月31日Y對上一個季度所有自變量線性相關(guān)系數(shù)
附表7 Y對上一個季度、本季度及未來一個季度的所有自變量X逐步回歸模型系數(shù)情況
附表8 兩種方式回歸結(jié)果對比
附錄
附錄一 數(shù)據(jù)倉庫中的數(shù)據(jù)表架構(gòu)
附錄二 數(shù)據(jù)倉庫關(guān)系圖
附錄三 QFII重倉股數(shù)據(jù)的獲取過程
附錄四 自變量數(shù)據(jù)的獲得及缺失值處理
附錄五 模型建立一數(shù)據(jù)分析過程
章節(jié)摘錄
版權(quán)頁: 插圖: 一、信息需求分類 毫無疑問,任何信息系統(tǒng)都不可能滿足所有客戶的需求,因此,為客戶提供最需要的信息成為信息系統(tǒng)的必然目標(biāo),而選擇目標(biāo)信息的基礎(chǔ)是信息分類。通常分類變量有地域、客戶職業(yè)等。另外,判斷一個人將來需求行為的最好指標(biāo)是他過去的需求行為,這是進行客戶需求歷史分析的真正意義所在。這樣我們就可以找出信息需求對哪些因素敏感,如地區(qū)差異、不同客戶職業(yè)等因素。 信息需求分類挖掘所要解決的問題是,根據(jù)實際情況找出客戶職業(yè)、地理區(qū)域等因素與信息需求量之間的關(guān)系并建立模式,以便決策者通過調(diào)整服務(wù)對策,給予客戶更多的幫助,并對急需的信息做出預(yù)測。 二、客戶細分 客戶細分是指將一個大的客戶群劃分成為不同的細分群的動作,每個細分群的客戶擁有相似的屬性,屬于不同細分群的客戶被視為不同的客戶群。這種相似可以是地理區(qū)域的相似、收入上的相似或其他方式的相似。細分可以讓用戶從比較高的層次上來看整個數(shù)據(jù)庫的數(shù)據(jù),從而使人們可以用不同的方式來對待處于不同細分群的客戶,從而提高客戶的滿意度。 在農(nóng)業(yè)呼叫中心中,可以通過對特定客戶背景信息的分析,預(yù)測該客戶所屬的客戶類別。而且分析客戶的組成情況(地區(qū)差異,接人方式的差異),能更好地了解客戶,從而采取相應(yīng)的服務(wù)策略,這樣可以有效地提高服務(wù)質(zhì)量,達到最佳的效果。這樣既能夠提高信息機構(gòu)的服務(wù)水平,開發(fā)客戶資源,避免客戶流失,又能夠節(jié)約資源,利用最小的投入得到較大的社會效益。 值得一提是,利用數(shù)據(jù)挖掘技術(shù)進行信息需求分類和客戶細分與OLAP的根本區(qū)別在于,前者能夠以更全面的視角洞察信息需求和客戶,同時發(fā)現(xiàn)一些隱藏在數(shù)據(jù)背后的規(guī)律;而后者則是根據(jù)人的主觀意圖,通過向數(shù)據(jù)庫發(fā)出指令,從數(shù)據(jù)庫中得到一個結(jié)果。 第二節(jié) 解決方案 處理大量、混亂又復(fù)雜的數(shù)據(jù)的一個很好方法是分類,分類可以讓決策者從比較高的層次上來看整個數(shù)據(jù)庫的數(shù)據(jù)。在分類技術(shù)發(fā)展過程中,流行的幾種分類技術(shù)方法包括貝葉斯分類、神經(jīng)網(wǎng)絡(luò)、遺傳算法、統(tǒng)計學(xué)方法、粗略集合方法、最近鄰居方法和決策樹算法等。
編輯推薦
《數(shù)據(jù)挖掘理論與實例》是一種技術(shù),它將傳統(tǒng)的數(shù)據(jù)分析方法與處理大量數(shù)據(jù)的復(fù)雜算法相結(jié)合?!稊?shù)據(jù)挖掘理論與實例》的主要目標(biāo)是通過不同領(lǐng)域的應(yīng)用案例來說明數(shù)據(jù)挖掘在實際應(yīng)用中的具體操作方法。將數(shù)據(jù)庫管理系統(tǒng)MySQL和統(tǒng)計軟件R結(jié)合,利用數(shù)據(jù)挖掘技術(shù)幫助陷入海量數(shù)據(jù)中的組織和個人提取有用的信息。
圖書封面
評論、評分、閱讀與下載