出版時間:2009-2 出版社:朱永生 科學出版社 (2009-02出版) 作者:朱永生 頁數:188
Tag標簽:無
前言
復雜大系統(tǒng)的科學研究往往都需要收集和處理大量反映系統(tǒng)特征和運行狀態(tài)的數據信息,這類原始數據集合由于樣本數量巨大,刻畫系統(tǒng)特征的指標變量眾多,并且?guī)в须S機性質,以致于形成了規(guī)模宏大、復雜難辨的數據海洋。利用統(tǒng)計學和數學方法對多維復雜數據集合進行科學的分析,挖掘出隱藏在復雜海量數據中的規(guī)律和信息,就是多元統(tǒng)計分析研究的基本內容。大型高能物理實驗就是典型的復雜大系統(tǒng)的科學研究工作。20世紀80年代末北京正負電子對撞機(BEPC)和北京譜儀(BES)的建成,是中國高能加速器實驗物理的真正開端。在北京譜儀上進行實驗工作的研究組是以譜儀的名稱fBeijing Spectrometer)命名的,簡稱BES合作組,它是由多國物理學家組成的國際合作研究組,我國物理學家在其中占有主導性的地位。北京譜儀成功地運行到2004年,獲取了百一粲能區(qū)海量的高能物理實驗數據。在此基礎上,應用多元統(tǒng)計分析方法對實驗數據進行分析,獲得了大量居于當時世界領先水平的物理成果。其中,百輕子質量的精確測量、2—5GeV能區(qū)R值的精確測量、共振態(tài)X(1835)的實驗觀察、δ粒子的實驗確定,更是引起當時國際高能物理界廣泛矚目的重大成就。為了保持和發(fā)展我國在高能物理百粲能區(qū)實驗研究的領先地位,我國政府又撥巨資對北京正負電子對撞機和北京譜儀進行升級改進,稱為BEPCII和BESIII。BEPCII的設計指標是產生粒子反應的強度約為原對撞機的100倍,BESIII的性能則比原北京譜儀有大幅度的提高。目前,BEPCII和BESIII已經完成安裝,并在2008年開始實驗取數。有理由期望,利用升級改進后的:BESIII,可以獲得比原北京譜儀更多、更精細、更重要的物理成果。為了達到這一目標,應用比原北京譜儀數據分析更為精細、更為有效的多元統(tǒng)計分析方法成為一個十分重要和急迫的任務。事實上,多元統(tǒng)計分析方法應用于高能物理實驗數據分析近年來已經成為國際高能物理界的一種普遍趨勢。
內容概要
《實驗數據多元統(tǒng)計分析》介紹實驗或測量數據的多元統(tǒng)計分析方法,內容包括:貝葉斯決策、線性判別方法、決策樹判別、人工神經網絡、近鄰法、概率密度估計量法、"矩陣判別、函數判別分析、支持向量機法等,以及不同判別方法的比較。此外,還簡要介紹了將多種多元統(tǒng)計分析方法的計算機程序匯集在一起的程序包TMVA(toolkit for multivariate data analysis),并分析了粒子物理實驗數據分析中應用多元統(tǒng)計分析方法的一些實例。 《實驗數據多元統(tǒng)計分析》可供實驗物理王作者和大專院校相關專業(yè)師生、理論物理研究人員、工程技術人員及從事自然科學和社會科學的數據測量和分析研究人員參考。
書籍目錄
前言第一章 緒論1.1 模式和模式識別1.2 模式識別系統(tǒng)1.2.1 原始數據獲取1.2.2 原始數據的預處理1.2.3 特征提取和選擇1.2.4 分類決策1.3 數據矩陣與樣本空間1.3.1 數據矩陣與樣本空間1.3.2 模式的相似性度量1.3.3 樣本點的權重和特征向量數據的預處理1.4 主成分分析1.4.1 主成分分析的基本思想1.4.2 主成分分析算法1.4.3 降維處理及信息損失第二章 貝葉斯決策2.1 基于最小錯誤率的貝葉斯決策2.1.1 決策規(guī)則2.1.2 錯誤率2.1.3 分類器設計2.2 Neyman-Pearson決策2.3 正態(tài)分布時的貝葉斯決策2.4 分類器的效率和錯誤率2.4.1 分類器的效率、錯誤率和判選率矩陣2.4.2 錯誤率的上界2.4.3 利用檢驗樣本集估計判選率矩陣和錯誤率2.4.4 訓練樣本集和檢驗樣本集的劃分2.4.5 利用判選率矩陣估計各類“真實”樣本數2.4.6 分類器判定的“信號”樣本中錯判事例的扣除2.5 討論第三章線性判別方法3.1 線性判別函數3.1.1 線性判別函數的基本概念3.1.2 廣義線性判別函數3.1.3 線性分類器的設計3.2 Fisher線性判別3.3 感知準則函數3.3.1 幾個基本概念3.3.2 感知準則函數3.4 最小錯分樣本數準則函數3.5 最小平方誤差準則函數3.5.1 平方誤差準則函數及其MSE解3.5.2 MSE準則函數的梯度下降算法3.5.3 隨機MSE準則函數及其隨機逼近算法3.6 多類問題第四章 決策樹判別4.1 超長方體分割法4.1.1 超長方體分割法的基本思想4.1.2 超長方體分割法中闡值的確定4.1.3 超長方體分割法的優(yōu)缺點及其改進4.1.4 超長方體分割法用于高能物理實驗分析4.2 決策樹法4.2.1 決策樹法的基本思想4.2.2 信號/本底二元決策樹的構建4.2.3 決策樹的修剪4.3 決策樹林法4.3.1 決策樹林的構建4.3.2 決策樹林對輸入事例的分類4.3.3 重抽樣法構建決策樹林第五章 人工神經網絡5.1 概述5.1.1 生物神經元和人工神經元5.1.2 人工神經網絡的構成和學習規(guī)則5.2 感知器5.2.1 單輸出單元感知器5.2.2 多輸出單元感知器5.3 多層前向神經網絡和誤差逆?zhèn)鞑ニ惴?.3.1 BP網絡學習算法5.3.2 BP網絡學習算法的改進5.4 Hopfield神經網絡5.4.1 離散Hopfield網絡5.4.2 連續(xù)Hopfield網絡5.4.3 Hopfield網絡在優(yōu)化計算中的應用5.5 隨機神經網絡5.5.1 隨機神經網絡的基本思想5.5.2 模擬退火算法5.5.3 Boltzmann機及其工作規(guī)則5.5.4 Boltzmann機學習規(guī)則5.5.5 隨機神經網絡小結5.6 神經網絡用于粒子鑒別5.6.1 用于帶電粒子鑒別的特征變量5.6.2 帶電粒子鑒別的神經網絡的架構5.6.3 網絡的訓練和粒子鑒別效果第六章 近鄰法6.1 最近鄰法6.2 尼近鄰法6.3 剪輯近鄰法6.3.1 兩分剪輯近鄰法6.3.2 重復剪輯近鄰法6.4 可作拒絕決策的近鄰法6.4.1 具有拒絕決策的k近鄰法6.4.2 具有拒絕決策的剪輯近鄰法第七章 其他非線性判別方法7.1 概率密度估計量方法7.1.1 基本思想7.1.2 總體概率密度的非參數估計7.1.3 投影似然比估計7.1.4 多維概率密度估計7.1.5 近鄰體積中樣本數的確定7.1.6 概率密度估計法與神經網絡的性能對比7.2 日矩陣判別7.3 函數判別分析7.4 支持向量機7.4.1 最優(yōu)分類面7.4.2 廣義最優(yōu)分類面7.4.3 支持向量機第八章 不同判別方法的比較8.1 不同判別方法的特點8.2 多元統(tǒng)計分析程序包TMVA簡介參考文獻
章節(jié)摘錄
第四章 決策樹判別前面我們討論了用線性判別函數設計分類器的方法。但是大量實際的模式識別問題并不是線性可分的,比如當兩類樣本的分布具有多峰性質并相互交錯時,簡單的線性判別函數往往會導致較大的分類錯誤。這種情況下就需要采用非線性分類器。從本章開始我們來討論幾種常用的、特別是在高能物理實驗數據分析中常用的非線性分類方法。4.1 超長方體分割法我們首先討論一種對于二類問題的最簡單的非線性判別方法——超長方體分割法,它可以認為是決策樹判別方法的一種最簡單的特例,但是由于它簡單、易實行的特點,在實驗數據的多元分析中,特別是高能物理實驗數據分析中,仍然有比較廣泛的應用。4.1.1 超長方體分割法的基本思想在本節(jié)的討論中,為了不失一般性,我們把樣本分為信號和本底兩個類別,信號指實驗中所要研究的過程的事例樣本,所有信號以外的樣本都屬于本底樣本。 超長方體分割法不是企圖用一個決策規(guī)則把兩類樣本一次分開,而是采用分級的方法來解決分類問題。它的基本思想如圖4.1所示。
編輯推薦
《實驗數據多元統(tǒng)計分析》是現代物理基礎叢書之一。
圖書封面
圖書標簽Tags
無
評論、評分、閱讀與下載