實(shí)驗(yàn)數(shù)據(jù)多元統(tǒng)計(jì)分析

出版時(shí)間:2009-2  出版社:朱永生 科學(xué)出版社 (2009-02出版)  作者:朱永生  頁(yè)數(shù):188  
Tag標(biāo)簽:無(wú)  

前言

復(fù)雜大系統(tǒng)的科學(xué)研究往往都需要收集和處理大量反映系統(tǒng)特征和運(yùn)行狀態(tài)的數(shù)據(jù)信息,這類(lèi)原始數(shù)據(jù)集合由于樣本數(shù)量巨大,刻畫(huà)系統(tǒng)特征的指標(biāo)變量眾多,并且?guī)в须S機(jī)性質(zhì),以致于形成了規(guī)模宏大、復(fù)雜難辨的數(shù)據(jù)海洋。利用統(tǒng)計(jì)學(xué)和數(shù)學(xué)方法對(duì)多維復(fù)雜數(shù)據(jù)集合進(jìn)行科學(xué)的分析,挖掘出隱藏在復(fù)雜海量數(shù)據(jù)中的規(guī)律和信息,就是多元統(tǒng)計(jì)分析研究的基本內(nèi)容。大型高能物理實(shí)驗(yàn)就是典型的復(fù)雜大系統(tǒng)的科學(xué)研究工作。20世紀(jì)80年代末北京正負(fù)電子對(duì)撞機(jī)(BEPC)和北京譜儀(BES)的建成,是中國(guó)高能加速器實(shí)驗(yàn)物理的真正開(kāi)端。在北京譜儀上進(jìn)行實(shí)驗(yàn)工作的研究組是以譜儀的名稱(chēng)fBeijing Spectrometer)命名的,簡(jiǎn)稱(chēng)BES合作組,它是由多國(guó)物理學(xué)家組成的國(guó)際合作研究組,我國(guó)物理學(xué)家在其中占有主導(dǎo)性的地位。北京譜儀成功地運(yùn)行到2004年,獲取了百一粲能區(qū)海量的高能物理實(shí)驗(yàn)數(shù)據(jù)。在此基礎(chǔ)上,應(yīng)用多元統(tǒng)計(jì)分析方法對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行分析,獲得了大量居于當(dāng)時(shí)世界領(lǐng)先水平的物理成果。其中,百輕子質(zhì)量的精確測(cè)量、2—5GeV能區(qū)R值的精確測(cè)量、共振態(tài)X(1835)的實(shí)驗(yàn)觀察、δ粒子的實(shí)驗(yàn)確定,更是引起當(dāng)時(shí)國(guó)際高能物理界廣泛矚目的重大成就。為了保持和發(fā)展我國(guó)在高能物理百粲能區(qū)實(shí)驗(yàn)研究的領(lǐng)先地位,我國(guó)政府又撥巨資對(duì)北京正負(fù)電子對(duì)撞機(jī)和北京譜儀進(jìn)行升級(jí)改進(jìn),稱(chēng)為BEPCII和BESIII。BEPCII的設(shè)計(jì)指標(biāo)是產(chǎn)生粒子反應(yīng)的強(qiáng)度約為原對(duì)撞機(jī)的100倍,BESIII的性能則比原北京譜儀有大幅度的提高。目前,BEPCII和BESIII已經(jīng)完成安裝,并在2008年開(kāi)始實(shí)驗(yàn)取數(shù)。有理由期望,利用升級(jí)改進(jìn)后的:BESIII,可以獲得比原北京譜儀更多、更精細(xì)、更重要的物理成果。為了達(dá)到這一目標(biāo),應(yīng)用比原北京譜儀數(shù)據(jù)分析更為精細(xì)、更為有效的多元統(tǒng)計(jì)分析方法成為一個(gè)十分重要和急迫的任務(wù)。事實(shí)上,多元統(tǒng)計(jì)分析方法應(yīng)用于高能物理實(shí)驗(yàn)數(shù)據(jù)分析近年來(lái)已經(jīng)成為國(guó)際高能物理界的一種普遍趨勢(shì)。

內(nèi)容概要

  《實(shí)驗(yàn)數(shù)據(jù)多元統(tǒng)計(jì)分析》介紹實(shí)驗(yàn)或測(cè)量數(shù)據(jù)的多元統(tǒng)計(jì)分析方法,內(nèi)容包括:貝葉斯決策、線性判別方法、決策樹(shù)判別、人工神經(jīng)網(wǎng)絡(luò)、近鄰法、概率密度估計(jì)量法、"矩陣判別、函數(shù)判別分析、支持向量機(jī)法等,以及不同判別方法的比較。此外,還簡(jiǎn)要介紹了將多種多元統(tǒng)計(jì)分析方法的計(jì)算機(jī)程序匯集在一起的程序包TMVA(toolkit for multivariate data analysis),并分析了粒子物理實(shí)驗(yàn)數(shù)據(jù)分析中應(yīng)用多元統(tǒng)計(jì)分析方法的一些實(shí)例?!  秾?shí)驗(yàn)數(shù)據(jù)多元統(tǒng)計(jì)分析》可供實(shí)驗(yàn)物理王作者和大專(zhuān)院校相關(guān)專(zhuān)業(yè)師生、理論物理研究人員、工程技術(shù)人員及從事自然科學(xué)和社會(huì)科學(xué)的數(shù)據(jù)測(cè)量和分析研究人員參考。

書(shū)籍目錄

前言第一章 緒論1.1 模式和模式識(shí)別1.2 模式識(shí)別系統(tǒng)1.2.1 原始數(shù)據(jù)獲取1.2.2 原始數(shù)據(jù)的預(yù)處理1.2.3 特征提取和選擇1.2.4 分類(lèi)決策1.3 數(shù)據(jù)矩陣與樣本空間1.3.1 數(shù)據(jù)矩陣與樣本空間1.3.2 模式的相似性度量1.3.3 樣本點(diǎn)的權(quán)重和特征向量數(shù)據(jù)的預(yù)處理1.4 主成分分析1.4.1 主成分分析的基本思想1.4.2 主成分分析算法1.4.3 降維處理及信息損失第二章 貝葉斯決策2.1 基于最小錯(cuò)誤率的貝葉斯決策2.1.1 決策規(guī)則2.1.2 錯(cuò)誤率2.1.3 分類(lèi)器設(shè)計(jì)2.2 Neyman-Pearson決策2.3 正態(tài)分布時(shí)的貝葉斯決策2.4 分類(lèi)器的效率和錯(cuò)誤率2.4.1 分類(lèi)器的效率、錯(cuò)誤率和判選率矩陣2.4.2 錯(cuò)誤率的上界2.4.3 利用檢驗(yàn)樣本集估計(jì)判選率矩陣和錯(cuò)誤率2.4.4 訓(xùn)練樣本集和檢驗(yàn)樣本集的劃分2.4.5 利用判選率矩陣估計(jì)各類(lèi)“真實(shí)”樣本數(shù)2.4.6 分類(lèi)器判定的“信號(hào)”樣本中錯(cuò)判事例的扣除2.5 討論第三章線性判別方法3.1 線性判別函數(shù)3.1.1 線性判別函數(shù)的基本概念3.1.2 廣義線性判別函數(shù)3.1.3 線性分類(lèi)器的設(shè)計(jì)3.2 Fisher線性判別3.3 感知準(zhǔn)則函數(shù)3.3.1 幾個(gè)基本概念3.3.2 感知準(zhǔn)則函數(shù)3.4 最小錯(cuò)分樣本數(shù)準(zhǔn)則函數(shù)3.5 最小平方誤差準(zhǔn)則函數(shù)3.5.1 平方誤差準(zhǔn)則函數(shù)及其MSE解3.5.2 MSE準(zhǔn)則函數(shù)的梯度下降算法3.5.3 隨機(jī)MSE準(zhǔn)則函數(shù)及其隨機(jī)逼近算法3.6 多類(lèi)問(wèn)題第四章 決策樹(shù)判別4.1 超長(zhǎng)方體分割法4.1.1 超長(zhǎng)方體分割法的基本思想4.1.2 超長(zhǎng)方體分割法中闡值的確定4.1.3 超長(zhǎng)方體分割法的優(yōu)缺點(diǎn)及其改進(jìn)4.1.4 超長(zhǎng)方體分割法用于高能物理實(shí)驗(yàn)分析4.2 決策樹(shù)法4.2.1 決策樹(shù)法的基本思想4.2.2 信號(hào)/本底二元決策樹(shù)的構(gòu)建4.2.3 決策樹(shù)的修剪4.3 決策樹(shù)林法4.3.1 決策樹(shù)林的構(gòu)建4.3.2 決策樹(shù)林對(duì)輸入事例的分類(lèi)4.3.3 重抽樣法構(gòu)建決策樹(shù)林第五章 人工神經(jīng)網(wǎng)絡(luò)5.1 概述5.1.1 生物神經(jīng)元和人工神經(jīng)元5.1.2 人工神經(jīng)網(wǎng)絡(luò)的構(gòu)成和學(xué)習(xí)規(guī)則5.2 感知器5.2.1 單輸出單元感知器5.2.2 多輸出單元感知器5.3 多層前向神經(jīng)網(wǎng)絡(luò)和誤差逆?zhèn)鞑ニ惴?.3.1 BP網(wǎng)絡(luò)學(xué)習(xí)算法5.3.2 BP網(wǎng)絡(luò)學(xué)習(xí)算法的改進(jìn)5.4 Hopfield神經(jīng)網(wǎng)絡(luò)5.4.1 離散Hopfield網(wǎng)絡(luò)5.4.2 連續(xù)Hopfield網(wǎng)絡(luò)5.4.3 Hopfield網(wǎng)絡(luò)在優(yōu)化計(jì)算中的應(yīng)用5.5 隨機(jī)神經(jīng)網(wǎng)絡(luò)5.5.1 隨機(jī)神經(jīng)網(wǎng)絡(luò)的基本思想5.5.2 模擬退火算法5.5.3 Boltzmann機(jī)及其工作規(guī)則5.5.4 Boltzmann機(jī)學(xué)習(xí)規(guī)則5.5.5 隨機(jī)神經(jīng)網(wǎng)絡(luò)小結(jié)5.6 神經(jīng)網(wǎng)絡(luò)用于粒子鑒別5.6.1 用于帶電粒子鑒別的特征變量5.6.2 帶電粒子鑒別的神經(jīng)網(wǎng)絡(luò)的架構(gòu)5.6.3 網(wǎng)絡(luò)的訓(xùn)練和粒子鑒別效果第六章 近鄰法6.1 最近鄰法6.2 尼近鄰法6.3 剪輯近鄰法6.3.1 兩分剪輯近鄰法6.3.2 重復(fù)剪輯近鄰法6.4 可作拒絕決策的近鄰法6.4.1 具有拒絕決策的k近鄰法6.4.2 具有拒絕決策的剪輯近鄰法第七章 其他非線性判別方法7.1 概率密度估計(jì)量方法7.1.1 基本思想7.1.2 總體概率密度的非參數(shù)估計(jì)7.1.3 投影似然比估計(jì)7.1.4 多維概率密度估計(jì)7.1.5 近鄰體積中樣本數(shù)的確定7.1.6 概率密度估計(jì)法與神經(jīng)網(wǎng)絡(luò)的性能對(duì)比7.2 日矩陣判別7.3 函數(shù)判別分析7.4 支持向量機(jī)7.4.1 最優(yōu)分類(lèi)面7.4.2 廣義最優(yōu)分類(lèi)面7.4.3 支持向量機(jī)第八章 不同判別方法的比較8.1 不同判別方法的特點(diǎn)8.2 多元統(tǒng)計(jì)分析程序包TMVA簡(jiǎn)介參考文獻(xiàn)

章節(jié)摘錄

第四章 決策樹(shù)判別前面我們討論了用線性判別函數(shù)設(shè)計(jì)分類(lèi)器的方法。但是大量實(shí)際的模式識(shí)別問(wèn)題并不是線性可分的,比如當(dāng)兩類(lèi)樣本的分布具有多峰性質(zhì)并相互交錯(cuò)時(shí),簡(jiǎn)單的線性判別函數(shù)往往會(huì)導(dǎo)致較大的分類(lèi)錯(cuò)誤。這種情況下就需要采用非線性分類(lèi)器。從本章開(kāi)始我們來(lái)討論幾種常用的、特別是在高能物理實(shí)驗(yàn)數(shù)據(jù)分析中常用的非線性分類(lèi)方法。4.1 超長(zhǎng)方體分割法我們首先討論一種對(duì)于二類(lèi)問(wèn)題的最簡(jiǎn)單的非線性判別方法——超長(zhǎng)方體分割法,它可以認(rèn)為是決策樹(shù)判別方法的一種最簡(jiǎn)單的特例,但是由于它簡(jiǎn)單、易實(shí)行的特點(diǎn),在實(shí)驗(yàn)數(shù)據(jù)的多元分析中,特別是高能物理實(shí)驗(yàn)數(shù)據(jù)分析中,仍然有比較廣泛的應(yīng)用。4.1.1 超長(zhǎng)方體分割法的基本思想在本節(jié)的討論中,為了不失一般性,我們把樣本分為信號(hào)和本底兩個(gè)類(lèi)別,信號(hào)指實(shí)驗(yàn)中所要研究的過(guò)程的事例樣本,所有信號(hào)以外的樣本都屬于本底樣本。 超長(zhǎng)方體分割法不是企圖用一個(gè)決策規(guī)則把兩類(lèi)樣本一次分開(kāi),而是采用分級(jí)的方法來(lái)解決分類(lèi)問(wèn)題。它的基本思想如圖4.1所示。

編輯推薦

《實(shí)驗(yàn)數(shù)據(jù)多元統(tǒng)計(jì)分析》是現(xiàn)代物理基礎(chǔ)叢書(shū)之一。

圖書(shū)封面

圖書(shū)標(biāo)簽Tags

無(wú)

評(píng)論、評(píng)分、閱讀與下載


    實(shí)驗(yàn)數(shù)據(jù)多元統(tǒng)計(jì)分析 PDF格式下載


用戶(hù)評(píng)論 (總計(jì)1條)

 
 

  •   挺不錯(cuò)的,可以作為入門(mén)的資料
 

250萬(wàn)本中文圖書(shū)簡(jiǎn)介、評(píng)論、評(píng)分,PDF格式免費(fèi)下載。 第一圖書(shū)網(wǎng) 手機(jī)版

京ICP備13047387號(hào)-7