出版時(shí)間:2008-5 出版社:科學(xué)出版社 作者:石磊 頁(yè)數(shù):177
Tag標(biāo)簽:無(wú)
內(nèi)容概要
本書系統(tǒng)介紹了多水平模型中的統(tǒng)計(jì)模型診斷問(wèn)題。主要內(nèi)容是:介紹了異常值和影響點(diǎn)的定義和歷史發(fā)展,數(shù)據(jù)刪除法和局部影響分析的一些主要方法和結(jié)果,以及多水平模型的定義、參數(shù)估計(jì)及統(tǒng)計(jì)推斷;總結(jié)了已知協(xié)方差結(jié)構(gòu)的廣義線性模型的統(tǒng)計(jì)診斷結(jié)果,并采用刪除多個(gè)數(shù)據(jù)點(diǎn)的方法研究了多水平模型中固定效應(yīng)及隨機(jī)效應(yīng)參數(shù)的診斷統(tǒng)計(jì)量;研究了多水平模型下基于均值漂移模型的異常點(diǎn)探測(cè)問(wèn)題、高水平單元的局部影響分析和單個(gè)觀察值的局部影響分析。本書還介紹了目前關(guān)于多水平模型的統(tǒng)計(jì)軟件,同時(shí)給出了利用Matlab語(yǔ)言編寫的計(jì)算程序?! ”緯勺鳛閿?shù)理統(tǒng)計(jì)專業(yè)本科生、碩士生和博士生的教材或參考書,也可作為數(shù)學(xué)、生物、醫(yī)學(xué)、工程、經(jīng)濟(jì)領(lǐng)域的教師及相關(guān)科技工作者的參考書。
書籍目錄
前言第1章 引論 1.1 基本概念 1.1.1 異常值 1.1.2 影響點(diǎn) 1.1.3 異常值和影響點(diǎn)的處理 1.2 預(yù)備知識(shí) 1.2.1 一些矩陣代數(shù) 1.2.2 矩陣微商 1.2.3 分布、估計(jì)及檢驗(yàn)理論 1.3 數(shù)據(jù)刪除法 1.3.1 Cook距離 1.3.2 基于影響函數(shù)的研究 1.3.3 殘差 1.4 局部影響分析 1.4.1 Cook的局部影響分析方法 1.4.2 廣義影響函數(shù)及局部影響分析第2章 多水平模型 2.1 引言 2.2 參數(shù)估計(jì) 2.2.1 IGLS估計(jì)理論 2.2.2 RIGLS估計(jì)理論 2.3 假設(shè)檢驗(yàn)及置信區(qū)間 2.3.1 固定效應(yīng)參數(shù) 2.3.2 隨機(jī)效應(yīng)參數(shù) 2.3.3 似然比檢驗(yàn) 2.4 殘差 2.5 數(shù)據(jù)分析及建模 2.5.1 “小學(xué)項(xiàng)目”(JSP)數(shù)據(jù) 2.5.2 血清膽紅素?cái)?shù)據(jù) 2.6 其他多水平模型 2.6.1 多元多水平模型 2.6.2 非線性多水平模型 2.6.3 離散數(shù)據(jù)的多水平模型第3章 GLM模型的影響分析 3.1 均值漂移模型及異常值檢驗(yàn) 3.2 數(shù)據(jù)刪除法 3.3 “刪除=替代”方法 3.3.1 條件殘差 3.3.2 “刪除=替代”診斷 3.4 殘差及單個(gè)數(shù)據(jù)點(diǎn)的影響度量. 3.4.1 預(yù)測(cè)殘差 3.4.2 影響函數(shù)及單個(gè)數(shù)據(jù)點(diǎn)的影響度量 3.5 GLM模型的局部影響分析 3.5.1 協(xié)方差矩陣擾動(dòng) 3.5.2 響應(yīng)變量擾動(dòng) 3.5.3 解釋性變量的擾動(dòng) 3.5.4 實(shí)例分析:血清膽紅素?cái)?shù)據(jù) 3.6 小結(jié)第4章 多水平模型的數(shù)據(jù)刪除 4.1 數(shù)據(jù)刪除度量 4.2 兩水平模型下的結(jié)論 4.3 線性混合模型中的應(yīng)用 4.4 實(shí)例分析 4.4.1 血清膽紅素?cái)?shù)據(jù) 4.4.2 JSP數(shù)據(jù) 4.5 小結(jié)第5章 多水平模型的異常點(diǎn)檢驗(yàn) 5.1 異常點(diǎn)檢驗(yàn) 5.1.1 均值漂移模型和檢驗(yàn)統(tǒng)計(jì)量 5.1.2 兩水平模型中異常點(diǎn)的探測(cè) 5.2 隨機(jī)部分異常點(diǎn)單元的探測(cè) 5.3 計(jì)算問(wèn)題 5.4 實(shí)例分析 5.4.1 JSP數(shù)據(jù) 5.4.2 血清膽紅素?cái)?shù)據(jù) 5.5 小結(jié)第6章 多水平模型高水平單元的局部影響分析 6.1 模型和符號(hào) 6.2 擾動(dòng)理論 6.2.1 V的一般結(jié)構(gòu) 6.2.2 V的塊對(duì)角 6.3 局部影響分析 6.3.1 擾動(dòng)的結(jié)果和局部影響測(cè)度 6.3.2 計(jì)算問(wèn)題 6.4 局部影響的一步近似 6.5 實(shí)例分析 6.6 小結(jié)第7章 多水平模型觀測(cè)點(diǎn)的局部影響分析 7.1 擾動(dòng)理論及結(jié)果 7.1.1 協(xié)方差矩陣的擾動(dòng)模型 7.1.2 響應(yīng)變量的擾動(dòng)模型 7.1.3 解釋性變量的擾動(dòng)模型 7.2 三種擾動(dòng)模式下的局部影響分析 7.2.1 局部診斷統(tǒng)計(jì)量 7.2.2 計(jì)算問(wèn)題 7.2.3 兩種特殊的模型 7.3 實(shí)例分析 7.3.1 JSP數(shù)據(jù) 7.3.2 血清膽紅素?cái)?shù)據(jù) 7.4 小結(jié)第8章 多水平模型軟件及Matlab計(jì)算程序 8.1 多水平模型軟件介紹 8.2 基于Matlab多水平模型的計(jì)算程序 8.2.1 對(duì)角協(xié)方差矩陣 8.2.2 一般協(xié)方差矩陣參考文獻(xiàn)附錄 實(shí)例中的數(shù)據(jù) 附表A 血清膽紅素?cái)?shù)據(jù)fSerum Bilirubin Datal 附表B JSP(junior school project)數(shù)據(jù)
章節(jié)摘錄
第1章 引論統(tǒng)計(jì)模型診斷是20世紀(jì)70年代中期發(fā)展起來(lái)的統(tǒng)計(jì)學(xué)領(lǐng)域一個(gè)新的研究方向,其主要目的是評(píng)價(jià)統(tǒng)計(jì)模型的適當(dāng)性以及識(shí)別數(shù)據(jù)中可能存在的異常值和強(qiáng)影響點(diǎn)。在模型適當(dāng)性的評(píng)價(jià)方面,線性模型中目前主要采用殘差分析來(lái)判斷模型擬合的好壞。異常值的識(shí)別主要在一定的異常模型假設(shè)下進(jìn)行統(tǒng)計(jì)檢驗(yàn)。而影響點(diǎn)的識(shí)別主要是研究數(shù)據(jù)點(diǎn)f或數(shù)據(jù)集)對(duì)我們關(guān)注的某個(gè)內(nèi)容的影響程度并識(shí)別數(shù)據(jù)中的特殊結(jié)構(gòu),這項(xiàng)工作也稱之為影響分析。統(tǒng)計(jì)模型診斷可以為統(tǒng)計(jì)模型的改進(jìn)提供重要的參考信息。在某些領(lǐng)域中,異常值及影響點(diǎn)還可以為我們提供某些特殊信息:如在地質(zhì)找礦中,異常值及影響點(diǎn)可能對(duì)應(yīng)著礦產(chǎn)資源富集信息;而在經(jīng)濟(jì)領(lǐng)域,異常的出現(xiàn)還可能是某種預(yù)警信息的表現(xiàn)。本書主要討論多水平模型中異常值和影響點(diǎn)的識(shí)別,但主要集中于多水平線性模型。本章主要給出統(tǒng)計(jì)模型診斷中涉及的基本概念和方法。l.1節(jié)主要回顧了異常值及影響點(diǎn)識(shí)別的發(fā)展及相關(guān)概念;l.2節(jié)給出了本書中經(jīng)常使用的一些矩陣知識(shí);1.3節(jié)以線性模型為例,介紹了標(biāo)準(zhǔn)線性模型中數(shù)據(jù)刪除法及相關(guān)結(jié)果;l.4節(jié)是關(guān)于局部影響分析的介紹。1.1.1 異常值1.1 基本概念異常值對(duì)我們現(xiàn)代人來(lái)說(shuō)并不陌生,我們甚至不自覺(jué)地會(huì)采用一些手段來(lái)處理現(xiàn)實(shí)生活中出現(xiàn)的異?,F(xiàn)象。最典型的就是在體育比賽中對(duì)裁判打分的平均算法:去掉一個(gè)最高分和最低分,再作平均。人們對(duì)異常值的認(rèn)識(shí)可以追朔到l6世紀(jì),Bernoulli提到:“在200多年前,人們丟掉異常值的處理方法已經(jīng)是常見(jiàn)的現(xiàn)象?!碧幚砗妥R(shí)別異常值的統(tǒng)計(jì)方法可追溯到l850年。雖然異常值的識(shí)別和處理方法在現(xiàn)代已經(jīng)發(fā)展很快,但是對(duì)異常值的定義依然有不同的理解和爭(zhēng)論。例如Edgeworth(1887)認(rèn)為:不一致觀測(cè)值(discordant observation)可以定義為那些與所在樣本中其他數(shù)據(jù)點(diǎn)遵從的頻率規(guī)則flaw of frequency)不一致的觀測(cè)值。82年后,Grubbs(1969)又這樣表述:一個(gè)異常的觀測(cè)值,即異常值,是嚴(yán)重偏離所在樣本其他數(shù)據(jù)點(diǎn)的觀測(cè)值。這些表述實(shí)質(zhì)上認(rèn)為異常值是有目的的、后驗(yàn)的.這種有目的性的識(shí)別異常值的方法,一般只能在數(shù)據(jù)中的異常值可以預(yù)先通過(guò)視覺(jué)觀察時(shí)才能使用(在一元小樣本中較多)。事實(shí)上,對(duì)樣本量較大或較為復(fù)雜的數(shù)據(jù)集,比如回歸、多元數(shù)據(jù)、試驗(yàn)設(shè)計(jì)等,預(yù)先觀察到異常值是很困難的.因此,就有在觀察到異常值之前制定一種客觀的準(zhǔn)則,這種準(zhǔn)則大多依賴于異常值模型(outlier model)。由于近幾年來(lái)強(qiáng)調(diào)統(tǒng)計(jì)建模的重要性,許多研究者認(rèn)為異常值是那些來(lái)自于非目標(biāo)總體(某種統(tǒng)計(jì)模型)的觀察值.Hawkins(1980)給出了一種比較明確的定義:異常值是指污染的觀測(cè)值或不一致觀測(cè)值的總稱。不一致觀測(cè)值是指那些讓調(diào)查者感到吃驚或有較大偏差的數(shù)據(jù)點(diǎn)。而污染的觀測(cè)值是指來(lái)自非目標(biāo)總體的觀測(cè)值。
編輯推薦
《多水平模型及其統(tǒng)計(jì)診斷》由科學(xué)出版社出版。
圖書封面
圖書標(biāo)簽Tags
無(wú)
評(píng)論、評(píng)分、閱讀與下載