出版時(shí)間:2011-6 出版社:首都經(jīng)濟(jì)貿(mào)易大學(xué)出版社 作者:朱梅紅 頁(yè)數(shù):129
內(nèi)容概要
社會(huì)發(fā)展離不開(kāi)數(shù)據(jù),而數(shù)據(jù)必須使用統(tǒng)計(jì)方法來(lái)加以分析。自威廉,配第《政治算術(shù)》始,歷史上幾乎每一次對(duì)社會(huì)經(jīng)濟(jì)發(fā)展的深刻理解都是建立在統(tǒng)計(jì)分析方法變革的基礎(chǔ)上的。正是這種變革所提供的各種數(shù)據(jù)分析工具加深了人們對(duì)社會(huì)經(jīng)濟(jì)本質(zhì)的理解,使得人們的認(rèn)識(shí)能夠還原真實(shí)世界并與之無(wú)限接近。統(tǒng)計(jì)學(xué)數(shù)百年的發(fā)展歷經(jīng)兩次方法上的“革命”:從最初不完整的全面調(diào)查方法到大樣本統(tǒng)計(jì)推斷,是統(tǒng)計(jì)方法的第一次革命;以大樣本統(tǒng)計(jì)推斷方法為基礎(chǔ),進(jìn)一步發(fā)展出小樣本統(tǒng)計(jì)推斷方法,是統(tǒng)計(jì)方法的第二次革命。這兩次革命都是施于用樣本數(shù)據(jù)推斷總體特征這一思想,而抽樣誤差的干擾導(dǎo)致統(tǒng)計(jì)方法日益復(fù)雜,使其應(yīng)用受到限制。目前,以數(shù)據(jù)挖掘方法為代表的統(tǒng)計(jì)學(xué)的第三次革命即將到來(lái)。數(shù)據(jù)挖掘是在繼承已有統(tǒng)計(jì)理論的基礎(chǔ)上,與計(jì)算機(jī)技術(shù)緊密結(jié)合,充分發(fā)揮計(jì)算機(jī)運(yùn)算速度快、存儲(chǔ)量大的特點(diǎn),將統(tǒng)計(jì)方法從抽樣推斷向海量數(shù)據(jù)分析推進(jìn),是統(tǒng)計(jì)學(xué)、計(jì)算機(jī)技術(shù)、仿真計(jì)算、機(jī)器學(xué)習(xí)、人工智能甚至哲學(xué)思想相融合的新學(xué)科,體現(xiàn)了科學(xué)發(fā)展“螺旋式上升”的哲學(xué)內(nèi)涵。
書(shū)籍目錄
1 緒論
1.1 研究背景
1.2 問(wèn)題的提出
1.3 基本概念
1.4 本書(shū)的研究?jī)?nèi)容與方法
1.5 本書(shū)的結(jié)構(gòu)安排
1.6 本書(shū)的特色與貢獻(xiàn)
2 文獻(xiàn)綜述
2.1 幾種線性規(guī)劃分類(lèi)模型
2.2 多目標(biāo)線性規(guī)劃分類(lèi)模型
2.3 分類(lèi)方法業(yè)績(jī)改進(jìn)的一般技術(shù)
2.4 本章主要結(jié)論
3 MCLP的偏差和方差分析
3.1 關(guān)于MCLP三個(gè)特性的一般理論
3.2 期望預(yù)測(cè)誤差的分解
3.3 數(shù)據(jù)準(zhǔn)備與實(shí)驗(yàn)安排
3.4 實(shí)驗(yàn)結(jié)果與分析
3.5 本章主要結(jié)論
4 MCLP在不平衡數(shù)據(jù)集上的業(yè)績(jī)分析
4.1 分類(lèi)業(yè)績(jī)?cè)u(píng)價(jià)標(biāo)準(zhǔn)及選擇
4.2 數(shù)據(jù)不平衡對(duì)分類(lèi)方法業(yè)績(jī)影響機(jī)制的一般結(jié)論
4.3 數(shù)據(jù)不平衡對(duì)MCLP業(yè)績(jī)影響機(jī)制的分析
4.4 數(shù)據(jù)不平衡對(duì)MCLP業(yè)績(jī)影響的實(shí)證分析
4.5 最優(yōu)類(lèi)分布結(jié)論的穩(wěn)定性分析
4.6 本章主要結(jié)論
5 組合分類(lèi)器方法對(duì)MCLP的業(yè)績(jī)改進(jìn)分析
5.1 Bagging和Adaboost程序
5.2 數(shù)據(jù)準(zhǔn)備與實(shí)驗(yàn)安排
5.3 兩種基本組合方法對(duì)MCLP的業(yè)績(jī)改進(jìn)分析
5.4 一種SmoothBoosting方法對(duì)MCLP的業(yè)績(jī)改進(jìn)分析
5.5 一種Sequential:Bagging方法對(duì)MCLP的業(yè)績(jī)改進(jìn)分析
5.6 隨機(jī)子空間方法對(duì)MCLP的業(yè)績(jī)改進(jìn)分析
5.7 本章主要結(jié)論
6 不平衡數(shù)據(jù)處理方法對(duì)MCLP的業(yè)績(jī)改進(jìn)分析
6.1 MCLP分類(lèi)中對(duì)不平衡數(shù)據(jù)的一般處理
6.2 數(shù)據(jù)準(zhǔn)備與實(shí)驗(yàn)安排
6.3 基于MCLP分類(lèi)結(jié)果的數(shù)據(jù)集特性分析
6.4 隨機(jī)上抽樣和隨機(jī)下抽樣方法對(duì)MCLP的業(yè)績(jī)改進(jìn)分析
6.5 一種改進(jìn)的單邊抽樣方法對(duì)MCLP的業(yè)績(jī)改進(jìn)分析
6.6 改進(jìn)的單邊抽樣+上抽樣方法對(duì)MCLP的業(yè)績(jī)改進(jìn)分析
6.7 一種正類(lèi)加權(quán)的MCLP模型及其業(yè)績(jī)改進(jìn)分析
6.8 不同方法在信用卡數(shù)據(jù)集上的業(yè)績(jī)比較分析
6.9 本章主要結(jié)論
7 總結(jié)與展望
7.1 主要研究結(jié)論
7.2 需要進(jìn)一步研究的問(wèn)題
參考文獻(xiàn)
章節(jié)摘錄
安全點(diǎn)的識(shí)別,需要我們從MCLP對(duì)數(shù)據(jù)集的初步分類(lèi)結(jié)果中進(jìn)行仔細(xì)研究?! ≈庇^上看,如果剔除靠左的即分值較小的負(fù)類(lèi)點(diǎn),相當(dāng)于新的訓(xùn)練集內(nèi)負(fù)類(lèi)點(diǎn)子分布偏右,此時(shí)訓(xùn)練集的線性可分程度增加。但是,MCLP為使目標(biāo)函數(shù)最優(yōu),會(huì)綜合考慮正負(fù)兩類(lèi),相應(yīng)的分類(lèi)邊界也就會(huì)右移。訓(xùn)練集上的分類(lèi)結(jié)果,必定是正類(lèi)正確率提高。如果將訓(xùn)練集的解代人測(cè)試集,也必定會(huì)使測(cè)試集的負(fù)類(lèi)正確率明顯降低,因?yàn)榉诸?lèi)邊界右移,而測(cè)試集內(nèi)負(fù)類(lèi)點(diǎn)密集分布在邊界處。左邊的負(fù)類(lèi)點(diǎn)剔除得越多,這種后果越嚴(yán)重?! ∠喾?,如果剔除靠右的即分值較大的負(fù)類(lèi)點(diǎn),相當(dāng)于新的訓(xùn)練集內(nèi)負(fù)類(lèi)點(diǎn)分布偏左。MCLP為使目標(biāo)函數(shù)最優(yōu),會(huì)綜合考慮正負(fù)兩類(lèi),相應(yīng)的分類(lèi)邊界就會(huì)左移。訓(xùn)練集上的分類(lèi)結(jié)果,必定是正類(lèi)正確率降低。如果將訓(xùn)練集的解代人測(cè)試集,也必定會(huì)使測(cè)試集的正類(lèi)正確率明顯降低,因?yàn)榉诸?lèi)邊界左移,而測(cè)試集內(nèi)正類(lèi)點(diǎn)也密集分布在邊界處。同樣,右邊的負(fù)類(lèi)點(diǎn)剔除得越多,這種后果越嚴(yán)重。 所以,只有小心地選擇安全點(diǎn),才能使測(cè)試集上兩類(lèi)的分類(lèi)結(jié)果比較均衡,AUC的值比較理想?! ?/pre>圖書(shū)封面
評(píng)論、評(píng)分、閱讀與下載
- 還沒(méi)讀過(guò)(84)
- 勉強(qiáng)可看(613)
- 一般般(104)
- 內(nèi)容豐富(4338)
- 強(qiáng)力推薦(355)
多目標(biāo)線性規(guī)劃分類(lèi)方法業(yè)績(jī)分析與改進(jìn)研究 PDF格式下載
250萬(wàn)本中文圖書(shū)簡(jiǎn)介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書(shū)網(wǎng) 手機(jī)版