出版時間:2011-6 出版社:首都經(jīng)濟貿(mào)易大學(xué)出版社 作者:朱梅紅 頁數(shù):129
內(nèi)容概要
社會發(fā)展離不開數(shù)據(jù),而數(shù)據(jù)必須使用統(tǒng)計方法來加以分析。自威廉,配第《政治算術(shù)》始,歷史上幾乎每一次對社會經(jīng)濟發(fā)展的深刻理解都是建立在統(tǒng)計分析方法變革的基礎(chǔ)上的。正是這種變革所提供的各種數(shù)據(jù)分析工具加深了人們對社會經(jīng)濟本質(zhì)的理解,使得人們的認(rèn)識能夠還原真實世界并與之無限接近。統(tǒng)計學(xué)數(shù)百年的發(fā)展歷經(jīng)兩次方法上的“革命”:從最初不完整的全面調(diào)查方法到大樣本統(tǒng)計推斷,是統(tǒng)計方法的第一次革命;以大樣本統(tǒng)計推斷方法為基礎(chǔ),進(jìn)一步發(fā)展出小樣本統(tǒng)計推斷方法,是統(tǒng)計方法的第二次革命。這兩次革命都是施于用樣本數(shù)據(jù)推斷總體特征這一思想,而抽樣誤差的干擾導(dǎo)致統(tǒng)計方法日益復(fù)雜,使其應(yīng)用受到限制。目前,以數(shù)據(jù)挖掘方法為代表的統(tǒng)計學(xué)的第三次革命即將到來。數(shù)據(jù)挖掘是在繼承已有統(tǒng)計理論的基礎(chǔ)上,與計算機技術(shù)緊密結(jié)合,充分發(fā)揮計算機運算速度快、存儲量大的特點,將統(tǒng)計方法從抽樣推斷向海量數(shù)據(jù)分析推進(jìn),是統(tǒng)計學(xué)、計算機技術(shù)、仿真計算、機器學(xué)習(xí)、人工智能甚至哲學(xué)思想相融合的新學(xué)科,體現(xiàn)了科學(xué)發(fā)展“螺旋式上升”的哲學(xué)內(nèi)涵。
書籍目錄
1 緒論
1.1 研究背景
1.2 問題的提出
1.3 基本概念
1.4 本書的研究內(nèi)容與方法
1.5 本書的結(jié)構(gòu)安排
1.6 本書的特色與貢獻(xiàn)
2 文獻(xiàn)綜述
2.1 幾種線性規(guī)劃分類模型
2.2 多目標(biāo)線性規(guī)劃分類模型
2.3 分類方法業(yè)績改進(jìn)的一般技術(shù)
2.4 本章主要結(jié)論
3 MCLP的偏差和方差分析
3.1 關(guān)于MCLP三個特性的一般理論
3.2 期望預(yù)測誤差的分解
3.3 數(shù)據(jù)準(zhǔn)備與實驗安排
3.4 實驗結(jié)果與分析
3.5 本章主要結(jié)論
4 MCLP在不平衡數(shù)據(jù)集上的業(yè)績分析
4.1 分類業(yè)績評價標(biāo)準(zhǔn)及選擇
4.2 數(shù)據(jù)不平衡對分類方法業(yè)績影響機制的一般結(jié)論
4.3 數(shù)據(jù)不平衡對MCLP業(yè)績影響機制的分析
4.4 數(shù)據(jù)不平衡對MCLP業(yè)績影響的實證分析
4.5 最優(yōu)類分布結(jié)論的穩(wěn)定性分析
4.6 本章主要結(jié)論
5 組合分類器方法對MCLP的業(yè)績改進(jìn)分析
5.1 Bagging和Adaboost程序
5.2 數(shù)據(jù)準(zhǔn)備與實驗安排
5.3 兩種基本組合方法對MCLP的業(yè)績改進(jìn)分析
5.4 一種SmoothBoosting方法對MCLP的業(yè)績改進(jìn)分析
5.5 一種Sequential:Bagging方法對MCLP的業(yè)績改進(jìn)分析
5.6 隨機子空間方法對MCLP的業(yè)績改進(jìn)分析
5.7 本章主要結(jié)論
6 不平衡數(shù)據(jù)處理方法對MCLP的業(yè)績改進(jìn)分析
6.1 MCLP分類中對不平衡數(shù)據(jù)的一般處理
6.2 數(shù)據(jù)準(zhǔn)備與實驗安排
6.3 基于MCLP分類結(jié)果的數(shù)據(jù)集特性分析
6.4 隨機上抽樣和隨機下抽樣方法對MCLP的業(yè)績改進(jìn)分析
6.5 一種改進(jìn)的單邊抽樣方法對MCLP的業(yè)績改進(jìn)分析
6.6 改進(jìn)的單邊抽樣+上抽樣方法對MCLP的業(yè)績改進(jìn)分析
6.7 一種正類加權(quán)的MCLP模型及其業(yè)績改進(jìn)分析
6.8 不同方法在信用卡數(shù)據(jù)集上的業(yè)績比較分析
6.9 本章主要結(jié)論
7 總結(jié)與展望
7.1 主要研究結(jié)論
7.2 需要進(jìn)一步研究的問題
參考文獻(xiàn)
章節(jié)摘錄
安全點的識別,需要我們從MCLP對數(shù)據(jù)集的初步分類結(jié)果中進(jìn)行仔細(xì)研究?! ≈庇^上看,如果剔除靠左的即分值較小的負(fù)類點,相當(dāng)于新的訓(xùn)練集內(nèi)負(fù)類點子分布偏右,此時訓(xùn)練集的線性可分程度增加。但是,MCLP為使目標(biāo)函數(shù)最優(yōu),會綜合考慮正負(fù)兩類,相應(yīng)的分類邊界也就會右移。訓(xùn)練集上的分類結(jié)果,必定是正類正確率提高。如果將訓(xùn)練集的解代人測試集,也必定會使測試集的負(fù)類正確率明顯降低,因為分類邊界右移,而測試集內(nèi)負(fù)類點密集分布在邊界處。左邊的負(fù)類點剔除得越多,這種后果越嚴(yán)重?! ∠喾矗绻蕹坑业募捶种递^大的負(fù)類點,相當(dāng)于新的訓(xùn)練集內(nèi)負(fù)類點分布偏左。MCLP為使目標(biāo)函數(shù)最優(yōu),會綜合考慮正負(fù)兩類,相應(yīng)的分類邊界就會左移。訓(xùn)練集上的分類結(jié)果,必定是正類正確率降低。如果將訓(xùn)練集的解代人測試集,也必定會使測試集的正類正確率明顯降低,因為分類邊界左移,而測試集內(nèi)正類點也密集分布在邊界處。同樣,右邊的負(fù)類點剔除得越多,這種后果越嚴(yán)重?! ∷?,只有小心地選擇安全點,才能使測試集上兩類的分類結(jié)果比較均衡,AUC的值比較理想?! ?/pre>圖書封面
評論、評分、閱讀與下載
多目標(biāo)線性規(guī)劃分類方法業(yè)績分析與改進(jìn)研究 PDF格式下載