出版時間:2008-5 出版社:科學(xué)出版社 作者:石磊 頁數(shù):177
Tag標(biāo)簽:無
內(nèi)容概要
本書系統(tǒng)介紹了多水平模型中的統(tǒng)計模型診斷問題。主要內(nèi)容是:介紹了異常值和影響點的定義和歷史發(fā)展,數(shù)據(jù)刪除法和局部影響分析的一些主要方法和結(jié)果,以及多水平模型的定義、參數(shù)估計及統(tǒng)計推斷;總結(jié)了已知協(xié)方差結(jié)構(gòu)的廣義線性模型的統(tǒng)計診斷結(jié)果,并采用刪除多個數(shù)據(jù)點的方法研究了多水平模型中固定效應(yīng)及隨機(jī)效應(yīng)參數(shù)的診斷統(tǒng)計量;研究了多水平模型下基于均值漂移模型的異常點探測問題、高水平單元的局部影響分析和單個觀察值的局部影響分析。本書還介紹了目前關(guān)于多水平模型的統(tǒng)計軟件,同時給出了利用Matlab語言編寫的計算程序。 本書可作為數(shù)理統(tǒng)計專業(yè)本科生、碩士生和博士生的教材或參考書,也可作為數(shù)學(xué)、生物、醫(yī)學(xué)、工程、經(jīng)濟(jì)領(lǐng)域的教師及相關(guān)科技工作者的參考書。
書籍目錄
前言第1章 引論 1.1 基本概念 1.1.1 異常值 1.1.2 影響點 1.1.3 異常值和影響點的處理 1.2 預(yù)備知識 1.2.1 一些矩陣代數(shù) 1.2.2 矩陣微商 1.2.3 分布、估計及檢驗理論 1.3 數(shù)據(jù)刪除法 1.3.1 Cook距離 1.3.2 基于影響函數(shù)的研究 1.3.3 殘差 1.4 局部影響分析 1.4.1 Cook的局部影響分析方法 1.4.2 廣義影響函數(shù)及局部影響分析第2章 多水平模型 2.1 引言 2.2 參數(shù)估計 2.2.1 IGLS估計理論 2.2.2 RIGLS估計理論 2.3 假設(shè)檢驗及置信區(qū)間 2.3.1 固定效應(yīng)參數(shù) 2.3.2 隨機(jī)效應(yīng)參數(shù) 2.3.3 似然比檢驗 2.4 殘差 2.5 數(shù)據(jù)分析及建模 2.5.1 “小學(xué)項目”(JSP)數(shù)據(jù) 2.5.2 血清膽紅素數(shù)據(jù) 2.6 其他多水平模型 2.6.1 多元多水平模型 2.6.2 非線性多水平模型 2.6.3 離散數(shù)據(jù)的多水平模型第3章 GLM模型的影響分析 3.1 均值漂移模型及異常值檢驗 3.2 數(shù)據(jù)刪除法 3.3 “刪除=替代”方法 3.3.1 條件殘差 3.3.2 “刪除=替代”診斷 3.4 殘差及單個數(shù)據(jù)點的影響度量. 3.4.1 預(yù)測殘差 3.4.2 影響函數(shù)及單個數(shù)據(jù)點的影響度量 3.5 GLM模型的局部影響分析 3.5.1 協(xié)方差矩陣擾動 3.5.2 響應(yīng)變量擾動 3.5.3 解釋性變量的擾動 3.5.4 實例分析:血清膽紅素數(shù)據(jù) 3.6 小結(jié)第4章 多水平模型的數(shù)據(jù)刪除 4.1 數(shù)據(jù)刪除度量 4.2 兩水平模型下的結(jié)論 4.3 線性混合模型中的應(yīng)用 4.4 實例分析 4.4.1 血清膽紅素數(shù)據(jù) 4.4.2 JSP數(shù)據(jù) 4.5 小結(jié)第5章 多水平模型的異常點檢驗 5.1 異常點檢驗 5.1.1 均值漂移模型和檢驗統(tǒng)計量 5.1.2 兩水平模型中異常點的探測 5.2 隨機(jī)部分異常點單元的探測 5.3 計算問題 5.4 實例分析 5.4.1 JSP數(shù)據(jù) 5.4.2 血清膽紅素數(shù)據(jù) 5.5 小結(jié)第6章 多水平模型高水平單元的局部影響分析 6.1 模型和符號 6.2 擾動理論 6.2.1 V的一般結(jié)構(gòu) 6.2.2 V的塊對角 6.3 局部影響分析 6.3.1 擾動的結(jié)果和局部影響測度 6.3.2 計算問題 6.4 局部影響的一步近似 6.5 實例分析 6.6 小結(jié)第7章 多水平模型觀測點的局部影響分析 7.1 擾動理論及結(jié)果 7.1.1 協(xié)方差矩陣的擾動模型 7.1.2 響應(yīng)變量的擾動模型 7.1.3 解釋性變量的擾動模型 7.2 三種擾動模式下的局部影響分析 7.2.1 局部診斷統(tǒng)計量 7.2.2 計算問題 7.2.3 兩種特殊的模型 7.3 實例分析 7.3.1 JSP數(shù)據(jù) 7.3.2 血清膽紅素數(shù)據(jù) 7.4 小結(jié)第8章 多水平模型軟件及Matlab計算程序 8.1 多水平模型軟件介紹 8.2 基于Matlab多水平模型的計算程序 8.2.1 對角協(xié)方差矩陣 8.2.2 一般協(xié)方差矩陣參考文獻(xiàn)附錄 實例中的數(shù)據(jù) 附表A 血清膽紅素數(shù)據(jù)fSerum Bilirubin Datal 附表B JSP(junior school project)數(shù)據(jù)
章節(jié)摘錄
第1章 引論統(tǒng)計模型診斷是20世紀(jì)70年代中期發(fā)展起來的統(tǒng)計學(xué)領(lǐng)域一個新的研究方向,其主要目的是評價統(tǒng)計模型的適當(dāng)性以及識別數(shù)據(jù)中可能存在的異常值和強(qiáng)影響點。在模型適當(dāng)性的評價方面,線性模型中目前主要采用殘差分析來判斷模型擬合的好壞。異常值的識別主要在一定的異常模型假設(shè)下進(jìn)行統(tǒng)計檢驗。而影響點的識別主要是研究數(shù)據(jù)點f或數(shù)據(jù)集)對我們關(guān)注的某個內(nèi)容的影響程度并識別數(shù)據(jù)中的特殊結(jié)構(gòu),這項工作也稱之為影響分析。統(tǒng)計模型診斷可以為統(tǒng)計模型的改進(jìn)提供重要的參考信息。在某些領(lǐng)域中,異常值及影響點還可以為我們提供某些特殊信息:如在地質(zhì)找礦中,異常值及影響點可能對應(yīng)著礦產(chǎn)資源富集信息;而在經(jīng)濟(jì)領(lǐng)域,異常的出現(xiàn)還可能是某種預(yù)警信息的表現(xiàn)。本書主要討論多水平模型中異常值和影響點的識別,但主要集中于多水平線性模型。本章主要給出統(tǒng)計模型診斷中涉及的基本概念和方法。l.1節(jié)主要回顧了異常值及影響點識別的發(fā)展及相關(guān)概念;l.2節(jié)給出了本書中經(jīng)常使用的一些矩陣知識;1.3節(jié)以線性模型為例,介紹了標(biāo)準(zhǔn)線性模型中數(shù)據(jù)刪除法及相關(guān)結(jié)果;l.4節(jié)是關(guān)于局部影響分析的介紹。1.1.1 異常值1.1 基本概念異常值對我們現(xiàn)代人來說并不陌生,我們甚至不自覺地會采用一些手段來處理現(xiàn)實生活中出現(xiàn)的異?,F(xiàn)象。最典型的就是在體育比賽中對裁判打分的平均算法:去掉一個最高分和最低分,再作平均。人們對異常值的認(rèn)識可以追朔到l6世紀(jì),Bernoulli提到:“在200多年前,人們丟掉異常值的處理方法已經(jīng)是常見的現(xiàn)象?!碧幚砗妥R別異常值的統(tǒng)計方法可追溯到l850年。雖然異常值的識別和處理方法在現(xiàn)代已經(jīng)發(fā)展很快,但是對異常值的定義依然有不同的理解和爭論。例如Edgeworth(1887)認(rèn)為:不一致觀測值(discordant observation)可以定義為那些與所在樣本中其他數(shù)據(jù)點遵從的頻率規(guī)則flaw of frequency)不一致的觀測值。82年后,Grubbs(1969)又這樣表述:一個異常的觀測值,即異常值,是嚴(yán)重偏離所在樣本其他數(shù)據(jù)點的觀測值。這些表述實質(zhì)上認(rèn)為異常值是有目的的、后驗的.這種有目的性的識別異常值的方法,一般只能在數(shù)據(jù)中的異常值可以預(yù)先通過視覺觀察時才能使用(在一元小樣本中較多)。事實上,對樣本量較大或較為復(fù)雜的數(shù)據(jù)集,比如回歸、多元數(shù)據(jù)、試驗設(shè)計等,預(yù)先觀察到異常值是很困難的.因此,就有在觀察到異常值之前制定一種客觀的準(zhǔn)則,這種準(zhǔn)則大多依賴于異常值模型(outlier model)。由于近幾年來強(qiáng)調(diào)統(tǒng)計建模的重要性,許多研究者認(rèn)為異常值是那些來自于非目標(biāo)總體(某種統(tǒng)計模型)的觀察值.Hawkins(1980)給出了一種比較明確的定義:異常值是指污染的觀測值或不一致觀測值的總稱。不一致觀測值是指那些讓調(diào)查者感到吃驚或有較大偏差的數(shù)據(jù)點。而污染的觀測值是指來自非目標(biāo)總體的觀測值。
編輯推薦
《多水平模型及其統(tǒng)計診斷》由科學(xué)出版社出版。
圖書封面
圖書標(biāo)簽Tags
無
評論、評分、閱讀與下載