# Sample

■ 一些大原則：

─ 認定能夠實際接觸到的母群體，也就是抽樣架構（sampling frame）。 ─ 避免隨意抽樣（亦即非機率性的抽樣）。

─ 理想上是能做簡單隨機抽樣或系統抽樣。

─ 分層抽樣可以減少抽樣誤差。

─ 當母群體中每一位被抽樣的對象是分屬於某一團體時，則可考慮用隨機叢集抽樣（cluster sampling）。 ─ 當母群體很大時，應考慮用多階段抽樣。

─ 決定樣本的大小是以推估母數（parameter）時所欲達到之精準度為基礎。 ─ 大樣本並不能補償抽樣時的偏差或系統性偏差（sampling bias；systematic bias）。因此，良好的抽樣設計、問卷設計和增加回收率等都是減少偏差的重要步驟。

■ 在抽樣方面，需要做以下之判斷及決策:

─ 是否要用機率樣本（probability sample，亦即random sample）？ ─ 抽樣架構(the sampling frame)為何？也就是那些人真正有被抽選到之機會。 ─ 樣本之大小(The Sample Size)。

─ 抽樣設計(the sample design)，即抽選人或戶之實際策略。 ─ 回收率(the rate of response)，即真正得到資料者在選取樣本中之比例。

■ 樣本之選取的三個關鍵

─ 得到樣本時所用之the sample frame(樣本架構)。 ─ 樣本內每一單位或個案都必須是用機率抽樣之程序，獲得每一個單位都應知道被選取之機率為何。 ─ 抽樣設計之細節，如樣本大小，及抽樣程序等，都會影響到樣本之代表性。

■ The Sample Frame

任何一個選擇樣本之程序都會給一些人被選入樣本之機會，也同時會排除一些人。因此，第一個評估樣本品質之步驟即為了解the sample frame 。

─ 抽樣方法可以歸成三大類:

1. 抽樣是由一相當完整的名單中抽出樣本。 2. 抽樣是由一群因做某些事或到某些地方的人中抽出樣本。 3. 抽樣是透過幾個階段抽到樣本。

─ 不論抽樣方法為何，研究者要評估the sample frame 之三個特徵: 1. 包含性(comprehensiveness)與變異性（variation）。 2. 樣本中每一個人或單位都有已知之被選擇的機率。 3. 最後一個評估的標準是抽樣設計之效率(efficiency)。這標準主要牽涉到抽樣所需之成本效益的問題。

由於樣本推論之範圍限於the sample frame，因此研究者要報告什麼人有機會被選擇，什麼人被排在外，那些被排在外的是否有獨特之性質，以及是否有些被抽選者其被抽選之機率不明等。

■ 一個階段的抽樣

─ 簡單隨機抽樣：將抽樣架構中所有的元素編號後，再用一組亂數決定挑選哪些元素。 ─ 系統抽樣：將抽樣架構中每一個元素編號，但不用亂數選取，而是依照一定的抽樣間距。 ─ 分層抽樣：將母群體分成幾個次母群體（subpopulation）的分層（strata）後，從每個次母群體中抽出一定比例的隨機樣本。

■ 多階段抽樣

─ 由學校中抽選學生

─ 區域機率抽樣(Area Probability Sampling)

─ 隨機數字撥號(random-digit dialing)

■ 樣本推估及抽樣誤差

一般來說，隨機抽樣所得到的誤差假定為非系統性的偏差，因此我們可以推估樣本估計值之準確性。(您還記得the central limit theorem嗎?) 以下所談之原則雖是運用在所有的sample statistics，但是一般的estimates主要是means（平均數）。最常用來描述抽樣誤差之統計值即為標準誤差(standard error)，透過標準誤差我們可以計算信賴區間。 平均數之standard error 為 [pic] ， Var為樣本之變異量； 比例之SE為 [pic] ， p (1-p)為比例之變異量。

由以上公式可看出:

─ 樣本愈大，則抽樣誤差愈小。

─ 當原來樣本數小時，加大樣本數，會減少較多之誤差，但原樣本頗大時，加多樣本數能減少之誤差並不大。 ─ 當p = 0.5時，比例之抽樣誤差最大。

─ 上述之公式只用在simple random sample之情況。當抽樣不是簡單隨機時，樣本誤差之計算會隨設計之不同而不同，也會隨所注意之變項不同而不同。...

Please join StudyMode to read the full document