出版時間:2008-8 出版社:重慶大學出版社 作者:加里·T.亨利 頁數(shù):136 譯者:沈崇麟
Tag標簽:無
內容概要
本書所介紹的樣本設計的思路,為我們提供了在整個研究過程中如何在若干備擇設計方案中進行抉擇的基礎。我們將這一思路稱之為實用抽樣設計方法。我們之所以使用“實用”一詞是因為我們?yōu)樽x者介紹的框架,強調的是各種可供我們選擇的方案和如何在這些備擇方案中進行選擇的操作要領而非抽樣的理論。本書將在概念上對這樣的框架進行闡述的同時,還輔之以來自實際的抽樣實踐的詳盡實例。雖然本書并不打算多地從理論和數(shù)學的角度來介紹抽樣問題,但它介紹的內容都以以往的理論和數(shù)學的抽樣著作為基礎,而這些著作將為那些有志于對這方面文獻作更深入了解的讀者提供了一個完整的參考書目。 本書的主要閱讀對象是那些將抽樣作為自己的研究工具的研究人員。同樣,本書也可作為社會和政策科學的本科生的方法課的補充教材,以幫助那些有志于從事研究工作的學生學習有關抽樣的知識。除上述兩個用途之外,本書也可用作那些在計劃自己的研究項目時,在抽樣方面需要一些咨詢的研究人員的參考書。而那些計劃進行抽取大的、復雜的樣本的研究人員,則最好去尋求有經驗的抽樣專家的幫助。
作者簡介
加里·T.亨利(Gary T.Henry),在美國弗吉尼亞大學公共管理學教授研究方法、統(tǒng)計學、項目評估和政策分析等課程。曾擔任弗吉尼亞公立學校教學評估指標體系研究的項目負責人和中國某大學統(tǒng)計學客座教授。此外,他也是國家議會全國會議的成員和演講人。
早年在威斯康星大學取得博士學位之后,他進入了弗吉尼亞審計和評審委員會,在那里擔任首席方法專家,用定量方法進行教育、懲處和交通問題的研究。隨后在州內閣擔任教育部副部長。他的研究興趣涉及穩(wěn)健估計、實地因果關系評估和公正評測等方面。亨利博士是《評估評論》(Evaluation Review)和《公共管理評論》(Public.Administration Review)等雜志的非?;钴S的撰稿人和評審人。他也是美國評估協(xié)會規(guī)范和道德委員會的主席。
書籍目錄
第1章 導論 定義樣本 抽樣和效度 為什么要抽樣 本書概要第2章 樣本選擇方法 非概率抽樣 非概率樣本的用途 概率抽樣 結論第3章 實用樣本設計法 抽樣設計中的誤差源 實用抽樣設計的框架 抽樣前抉擇 研究的性質究竟是什么——探索性的、描述性的還是分析性的 最感興趣的變量是什么 研究的目標總體是什么 某些子總體或特定的群體是否對研究很重要 用什么樣的方法收集數(shù)據(jù) 是否宜于抽樣 抽樣抉擇 什么樣的目標總體清單可作為抽樣框使用 可容忍的誤差或估計的效應的大小是多少 采用什么類型的抽樣技術 選擇的概率是相等的還是不等的 選人樣本的單位是多少 抽樣后抉擇 如何評估無回答問題的影響 樣本數(shù)據(jù)是否需要加權 研究變量的標準誤差是什么 小結第4章 實用樣本設計的四個實例 北卡羅萊納州居民調查 抽樣前抉擇 抽樣抉擇 抽樣后抉擇 佛羅里達高齡老人調查 抽樣前抉擇 抽樣抉擇 抽樣后抉擇 弗吉尼亞出院精神病人調查 抽樣前抉擇 抽樣抉擇 抽樣后抉擇 調查研究中心的美國本土住戶樣本 抽樣前抉擇 抽樣抉擇 抽樣后抉撣 小結第5章 抽樣框 一般總體的抽樣框 特殊總體的抽樣框 總誤差和抽樣框 結論第6章 抽樣方法 簡單隨機抽樣 系統(tǒng)抽樣 分層抽樣 整群抽樣 多級抽樣 小結第7章 樣本容量 高效樣本的容量 樣本容量設計的實質 子總體分析 不合格和無問答的修正 費用 信度 小總體抽樣 小結第8章 抽樣后選擇 權的使用 無回答評估 陳述數(shù)據(jù) 結論參考文獻
章節(jié)摘錄
插圖:第二章樣本選擇方法樣本選擇方法可歸結為兩類:概率抽樣和非概率抽樣。概率樣本是以這樣的方式,即總體的每一成員實際上都有一個被選人樣本的概率選取的。非概率樣本的選取都基于研究者的主觀判斷。研究者一般都以手頭進行的研究所要達到的特定目標作為判斷的依據(jù)。本書主要介紹概率抽樣。其原因在于概率樣本使我們能對它們進行嚴格的統(tǒng)計分析,從而確定可能的偏倚和誤差。非概率樣本則不具備類似的優(yōu)點。但是在某些場合,非概率樣本也不失為一種頗為有用的工具。非概率抽樣很多研究項目都使用非概率樣本。這些樣本可以方便地或以某種系統(tǒng)的標準為根據(jù)選取。非概率樣本實際上是一組性質各異,用主觀判斷選擇的樣本的抽樣方法的總稱。這些方法在確定將總體中的哪些單位選人樣本時,都以主觀判斷為準。非概率樣本的選擇方法與概率樣本的不同,后者都采用基于某種隨機機制的選擇方法,以確保樣本的選擇能獨立于主觀判斷。常用的非概率樣本設計有以下六種:?方便樣本(Conveniencessamples)?最相似/最不相似樣本(Mostsimilar/mostdissimilarsamples)?典型個案樣本(Typicalcasesamples)?關鍵個案樣本(Criticalcasesamples)?滾雪球樣本(Snowballsamples)?配額樣本(Quotasamples)方便抽樣。方便樣本是由一組樂于接受調查的個人組成的樣本。例如,對電影中的暴力和美國民眾的攻擊性行為這兩者之間的關系感興趣的心理學家,可以在實驗中使用一些來自選修心理學導論課的學生的志愿者作為實驗對象。學生首先自愿報告他們自己對暴力問題的態(tài)度、傾向,再對他們在一個人為編排的沖突場景中的作為進行觀察。隨后我們用隨機分配法(randomassignment)將學生分成兩個組。隨機分配法是一種用來將自愿參加實驗的學生分為一個實驗組(treatmentgroup)和控制組(controlgroup)的專門技術。它不同于隨機抽樣。隨機抽樣是一種關乎整個樣本,即兩個組的所有成員的選擇的概率方法。我們在本例中使用的方便樣本不是隨機抽樣。在事后將樣本分為兩個組的時候,譬如像本例那樣,我們應該使用隨機分配法。一組成員被示以有暴力畫面的電影,另一組放映的電影則沒有暴力畫面。隨后我們對兩組的成員進行訪談,再觀察他們在可能有暴力沖突的場景中的言行。然后對兩組成員在電影放映前后的態(tài)度和行為的差異進行比較。參與這一實驗的學生便是一個方便樣本。他們是一個現(xiàn)存的群體的一部分,研究者很方便從這一群體中獲取志愿者。獲取數(shù)據(jù)的方便性只是研究者諸多目的中的一個目的。研究的主要目的還在于了解暴力電影對美國民眾的影響。但從這樣的樣本得到的數(shù)據(jù)究竟能使我們對這一問題有多少了解,則另當別論。除了暴力電影揭示的因素之外,在理論上講,還可能存在其他滋長暴力傾向的因素。這些其他的因素是一些混淆變量(confoundingvariable)。這些變量使我們難以確定自變量(independentvariable)(本例中的暴力電影)的影響。例如,個人在精神或情感上的壓抑程度可能被假設與暴力傾向有關。不僅如此,年輕人性格可能比較外向,因而更易具有暴力傾向。在這個意義上講,樣本中的所有學生(包括實驗組和控制組)較美國的成年人口總體的壓抑程度不是更高,就是更低。就存在于實驗組和控制組的攻擊性行為的差異而言,樂抑程度同樣也可能是一個混淆變量。如果學生的壓抑程度低于成年人口總體,那么我們實驗得出的暴力電影不會使暴力傾向有所增長的結論,并不適用于成年人口總體。這樣的設計的主要問題在于在問題涉及壓抑程度時,使用這樣的樣本作為總體的模型是不夠精確的。不僅如此,這樣的樣本也無法了解其他假設的可能引發(fā)暴力行為的因素。因此,我們無法斷定暴力電影的影響(或沒有影響)這樣的結論是否適用于樣本之外的場合。在本例中,年齡是一個更易觀察到的混淆因素。大專院校的學生年齡大多數(shù)在18到25歲之間。如果年輕的成年人更傾向于暴力行為的話,那么樣本就可能有偏向更高的侵略性行為的偏倚。選擇如本例所示的方便樣本,可能會使結果有偏倚,因而使我們無法將得出的結論推廣到總體。不言而喻,其他因素也可能對暴力態(tài)度和行為有所影響,而這些因素在樣本和總體之間的分布是不均衡的。不確定性和偏倚可以有兩種方法加以控制:一種方法是使用更多的數(shù)據(jù),對方便樣本加以改進;另一種方法是放棄使用方便樣本,改而使用概率樣本。首先,對那些易于量度的特征,如年齡,我們可以直接加以控制。一個可供我們選擇的方便樣本是比例代表樣本,即按每一年齡組的比例(但可能不是從一個心理學班)來分配和選擇樣本成員。我們難以得到有關總體的壓抑程度方面的信息。而這些信息對于分組和按比例地選擇個體都是必不可少的。隨機選擇可以確??傮w的每一成員都有被選人樣本的可能,給我們提供了一個控制壓抑程度的量度。隨機選擇是一種隱含的控制,用來得到多種特征,包括壓抑程度和其他尚未直接控制的特征的混合體。隨機選擇,作為概率抽樣的一個重要性質我們將在以下節(jié)進行介紹。我們有必要花費一點時間給大家介紹一下本例中將學生隨機地分配給實驗組和控制組的問題,以使大家對與內部效度(internalva—li(tity)有關的選擇偏倚有所了解(Cook&Campbell,1979)。這就是說,實驗組和控制組(二者均由來自該校心理學選修班的學生組成)之問的在侵略性行為上存在的差異可歸結為暴力電影的影響。隨機分配的目的在于去除那些任何其他也許可以解釋存在于志愿者身上的差異的變量。然而隨機分配并不能解決在將從樣本數(shù)據(jù)發(fā)現(xiàn)的效應外推到美國公眾時,可能發(fā)生的不確定性和偏倚的問題。在本例中,由于方便樣本的使用,使我們對樣本的發(fā)現(xiàn)的概括受到了很大限制。有關無家可歸者人口和非機構(deinstitutionalization,指20世紀末發(fā)生在美國社會中將精神病患者從公立醫(yī)院轉到社區(qū)醫(yī)療服務中心的趨勢,譯者注)問題的文獻為我們提供了一個采用方便樣本的具體例子。隨著政策制定者對無家可歸者問題的嚴重性認識的深入,他們也越來越急需我們能為他們提供有關的經驗數(shù)據(jù)。這就意味著更多的數(shù)據(jù)將使用方便樣本收集(Burnam&Koegel,1988)。通常教堂和其他各種為無家可歸者提供床位的場所都是我們用來選擇調查對象和收集數(shù)據(jù)的地方。因為有關什么樣的人才可以得到床位的規(guī)定將某些人排除在了樣本之外,所以這樣的樣本可能存在某些偏倚。此外,某些無家可歸者并不愿意,或不能通過得到一張床位所要求的手續(xù)。近年來,有兩個有關無家可歸者的研究,試圖為我們提供一些基于概率樣本的信息。羅西、賴特、費希爾和威利斯(Rossi,wright,F(xiàn)isher,andWillis,1987),以及伯納姆和考杰(Bumam&Koegel,1988)描述的方法,雖然比方便樣本需要更多的時間和預算,但是他們的發(fā)現(xiàn)確實與以前的調查有所不同。例如,伯納姆和考杰發(fā)現(xiàn)只有不到一半(44.2%)的無家可歸者在教堂或收容所的床上過夜,而基于方便樣本的這一數(shù)字幾乎為三分之二(66%)。二者存在明顯的差異。最相似/最不相似個案抽樣。最相似/最不相似樣本由立意樣本(purposefulsample)變化而來,多用于比較性的政體研究和政策取向的個案研究。為了比較政治、社會和經濟體系之間的關系,西方國家,如美國、加拿大、英國、法國、德國和意大利經常被組合在一起作為一個國家的樣本。其他的組合,例如發(fā)展中國家組合,則常被用來進行諸如國家債務的增加對國家的生活水平的影響這樣的研究。在最不相似設計中,為了對政策的實施結果進行比較,個案研究經常選擇“最好”和“最壞”的個案。如果個案和資源都比較有限,而所需的信息主要用來進行比較,這些研究是很有用的,但是問題在于,由這樣的研究得到的結論能否推廣到個案研究的范圍之外。在考慮財產稅率或斷定州資助是否適當時,一個地區(qū)常常需要將自己與相鄰的地區(qū)進行比較。在這種情況中,地理上的鄰近程度是相似性的操作定義。這些比較既可能,也可能不太精確地刻畫那些在課稅基數(shù)或提高地方收入能力相似的地區(qū)的相對位置。典型個案抽樣。在時間和資源極度不足時,我們也常常會改而選取非概率的樣本?!暗湫蛡€案”設計便是在遇有這樣的情況時采用的抽樣設計。在采用這樣的抽樣設計時,研究者選取為數(shù)不多的幾個、他們認為是正常的或一般的個案。為了提高設計的信度,那些看做獨特的或特殊的個案都不會被選人樣本。在這樣的設計中,研究者本人對總體的判斷和了解對于樣本的信度是至關重要的。在政策研究中,“典型個案”樣本的選取常常需要進行非常嚴密的詳細審查。對選擇偏倚的疑慮是這樣的樣本存在的一個普遍的問題。使用“典型個案”會引起人們對選取的個案進行詳細的審視,而在人們感到個案并非那么典型時,我們發(fā)現(xiàn)的那些信度就會因此而大為減色。這樣一種類型的設計的個案選擇法,其注意力主要集中在每一單獨的個案上。樣本變成了審視的焦點。關鍵個案抽樣。另一種在許多方面都與“典型個案”設計頗為相似的非概率樣本設計是“關鍵個案”設計。在關鍵個案設計中,研究者選擇了數(shù)目有限的幾個個案,這些個案在邏輯上或依據(jù)以往的經驗允許我們進行總體的推論。為了預測大選的結果,我們可以關鍵個案的邏輯為依據(jù)來選擇關鍵的選區(qū)。在美國社會幾乎是家喻戶曉的格言“緬因在握,美國在握”(AsMainegoes,SOgoesthenation),便是這一設計應用的極端例證。在1948年前的美國大選中,用緬因州的選舉結果來預測全美的選舉結果是非常靈驗的。1948年的大選中,緬因州的選民大多數(shù)都把票投給了杜威(Dewey)。于是有人喊出了這樣的口號“見緬因而知佛蒙特”(AsMainegoes.sogoesVer—mont)。滾雪球抽樣。與其他非概率樣本顯著不同的非概率樣本是滾雪球樣本。滾雪球抽樣借助先前確定的一組成員來確定總體中的其他成員。隨著新近確定的成員不斷列舉其他的成員,樣本如同滾雪球一般逐漸成長壯大。滾雪球抽樣多用于不存在總體的清單,且研究者也無法自行編撰諸如這樣的清單時。有關各種不同的群體,如非法僑民和社區(qū)“權力精英”的社會學研究常采用這種方法來生成總體的樣本。配額抽樣。另一種非概率抽樣得到的樣本是配額樣本。配額樣本將我們研究的總體的群體分為子群體,例如分為男性和女性,或白人、西班牙裔、美國印第安人和其他少數(shù)民族等。然后,根據(jù)在最終的樣本中所需的子群體的比例;分配給調查員既定的、需要他們選取和調查的每一子群體的樣本單元數(shù)。配額樣本與概率樣本,特別是與分層樣本有許多相似之處,但是它們在一個重要的方面卻不盡相同。配額樣本允許調查員在選取樣本個體時做主觀判斷。我們給調查員以明確的指示,告訴他們我們希望應選作調查對象的特征。例如,我們可能告訴調查員,在某一鄰里地區(qū)選取的被調查人數(shù),其中自人和黑人各多少,或在分配好的額度中,男性和女性各多少。在通常情況下,確定的各個子群體的數(shù)目將使整個樣本中各子群體所占比例與總體相同。但是我們必須要指出的是,配額樣本的被調查人是由調查員選擇的。斯圖加特(Stuart,1984)指出,配額樣本可能會引起三種問題:正如我們將要從這樣一種調查員的自由所證明的那樣,在群體抽樣中,總是存在著發(fā)生選擇的偏倚的危險,因為在這樣一種抽樣中,選擇程序的定義并不是十分明確的。至今我們仍然沒有可以用于估計這樣的樣本的標準誤差的有效方法……配額抽樣隱瞞了這樣那樣的無回答問題。(黑體系原作第43頁所強調的要點)我們之所以說配額抽樣隱瞞了無回答問題,是因為每當調查員在遇有拒絕接受調查的被調查人,或找不到戶中的任何人的時候,只是簡單地選另外一戶進行調查而已。因而調查員總是可以得到要求的調查數(shù),但是總體中那些難于聯(lián)系到的被調查人的比例卻可能會因此而被低估。庫克和坎貝爾建議采用一種特殊的配額抽樣法。他們把這種方法叫做“異質詳析抽樣模型”(themodelofdeliberatesamplingforhet—erogeneity)(Cook&Campbell,1979)。他們提出的這種配額抽樣策略,要求我們從各種各樣可能對調查結果有影響的背景和條件中來選取樣本成員?!耙虼艘粋€綜合性的教育實驗設計,必須包括來自城市、小鎮(zhèn)和農村地區(qū)的不同家庭背景的,在天資和價值觀上存在很大差異的男孩和女孩?!保–ook&Campbell,1979,P.75)而這樣一種設計的不足之處在于它難以用來進行歸納概括。研究者至多只可以說“至少從一個樣本來看,影響是存在的(或不存在的)”(Cook&Campbell,1979,P.76)。雖然在這樣一個層次上,我們的陳述可被認為是正確的,但是用一個不同的樣本,某些混淆變量(confoundingvariables)有可能使我們的發(fā)現(xiàn)不復存在。不了解樣本的前提條件,配額抽樣對于理論構建的用處是很有限的。此外,將發(fā)現(xiàn)限于某一個特定的樣本的做法,會使我們提供的信息對于政策所產生的影響變得十分有限。鑒于上述理由,配額樣本作為一種抽樣方法,并不為我們看好。盡管如此,我們一直還在使用配額抽樣,因為在通常情況下,它的費用比概率樣本低。在以戶為基本研究單位的研究中,我們有時會使用一種與配額樣本多少有些相似,但實際上卻是一種概率樣本的抽樣方法。帶有配額的概率樣本要求調查員在特定的地理位置,按照特定的路線,對配額規(guī)定的數(shù)目的被調查人進行調查。蘇德曼對我們之所以將這樣一種抽樣形式看做一種概率抽樣的根據(jù)做了簡要的闡述:配額概率樣本的基本假設是,被調查人是可以進行分層的,且層中宜于進行調查的概率是已知的……任何一個被調查人被調查的概率等于他最初被選到的概率與他的宜于進行調查的概率的積。(Sudman,1976,P.193)然而,配額概率抽樣是一種有偏的抽樣方法,盡管這種偏倚一般不算太大。此外,它的抽樣誤差也高于同樣容量的其他概率樣本(Hess,1985)。非概率樣本的用途在某些場合非概率樣本是一種有用和便于進行調查的抽樣方法。在許多情況中,它是一種比較合適的抽樣方法,而在某些時候,它是唯一可以使用的抽樣方法。例如在某些特定人口總體,如非法使用毒品的人口總體的研究中,我們不可能得到抽取概率樣本所需的清單。用于滾雪球式抽樣的列舉法可能是唯一可行的抽樣方法。在研究者的確對人口總體中的特定成員感興趣的時候,用這些特定成員而非整個人口總體中的所有成員來構成樣本時,采用非概率樣本也許也比較恰當。例如,某些比較性的政府研究更感興趣的是某些特定的國家,而非國家的分組(如發(fā)展中的債務國)。
編輯推薦
《實用抽樣方法》適用對象:“萬卷方法”的受眾;圖書館及大學社會科學各院系的資料室;社會科學工作者各領域的研究人員;社會科學工作者各學科研究方法課程的教學人員;社會科學工作者各專業(yè)的研究生和本科生。
圖書封面
圖書標簽Tags
無
評論、評分、閱讀與下載