兩比例差異檢定就實務面上其實有相當多可以討論的主題。
採自PTT Militarylife 15452摘錄內容:
「國軍99年度判決確定167人中,以階級結構區分,校官合計20人,占12%;尉官合計13
人,占7.8%;士官合計73人,占43.7%;士兵合計61人,占36.5%,其中以士官犯罪占
最多數;若以領導職之軍士官犯罪計算,總計高達106人(占63.5%),可見酒後駕車犯
罪多存在於基層領導幹部。
若以役別結構區分,
志願役130人(占77.8%),義務役37人(占22.2%)。」
本篇鍵盤分析並無對役別存在特定偏見,
統計方法實際上亦非科學評析的唯一方式。
而放大字體則為本篇討論重點:
鳩~~~竟,志願役酒駕比例在統計意義上是否顯著高於義務役呢??
先回顧一個兩比例Z檢定 (two-proportional Z-test) 的例子:
給Q牌DNA Extraction kit 120mg的粗萃取 (crude extract),
給G牌類似功能之kit 150mg粗萃取。
已知兩份粗萃取實際上均含100mg的DNA,
elute後之結果,Q得到80mg,G拿到70mg,
檢定兩者之DNA萃取比例是否相同?
令PQ為Q牌萃取比;PG為G牌萃取比。
H0: PQ=PG
H1: PQ與PG不相等
α=0.05
建構2X2表格如下:
Q G T
萃取 80 70 150
未萃取 20 30 50
T 100 100 200
Zα=(80/100-70/100)/(√[2*(1/100)*(150/200)*(50/200)])=1.633
<Z0.975=1.96
Accept H0 無法說Q牌之萃取率確實比G牌優異,即便檢定標的改為單尾:
H0: PQ<=PG
H1: PQ>PG
Z0.95=1.645。
回到討論的主題,可發現2X2表格難以建立,因為實際上只有2X1。
役別 志願役 義務役 T
酒駕 130 37 167
是不是把2X2表轉成如下的2X1呢?
Q G T 萃取 未萃取 T
萃取 80 70 150 或 Q 80 20 100
好。因此分母的標準差勢必有所不同。我們可以先建構一個無母數的卡方檢定。
這裡的卡方為什麼是無母數呢? 因為我們不需要用到任何母數,即均值及標準差,
只需了解觀察值與估計值即可。
H0: 兩種役別酒駕情形相同
H1: 酒駕情形不同 α=0.05
役別 志願役 義務役 T
酒駕觀察值(Oi) 130 37 167
估計值(Ei) 83.5 83.5 167
X^2=Σ[(|Oi-Ei|-0.5)^2 / Ei]=50.68 >> X^2 (0.95 DF=1)=3.84
Reject H0 達顯著差異,志願役酒駕情形確實比義務役嚴重。
0.5的扣減值為DF=1卡方檢定的葉式連續校正(Yates Correction)結果。
實務上,如果卡方數值大,則校不校正沒有太大差異,因為這是
防止數值過小的校正方式。(原諒小的不學無術,無法就此做詳細說明)
以比例法,虛無假設建構同上述卡方。
令 Pa = 志願役酒駕比例、Pb = 義務役酒駕比例
H0:兩種役別酒駕情形相同 (Pa=Pb=P0=0.5)
H1: 酒駕情形不同 α=0.05
因此,標準差應為:√[0.5^2/167]=0.0387
以Zα=(p-p0)/√[(p0^2)/n]說明,p0為虛無假設之0.5,為真則兩種役別酒駕能力一樣好(廢話)
Zα=(130/167-83.5/167)/σ = 0.557/0.0387 = 7.19 >> Z0.95 & Z0.975
即不論單尾(懶惰不寫了)或雙尾,志願役酒駕比例皆顯著大於義務役。
好。紅色數值又表示甚麼意義呢??
X^2(1,1-α) = Z^2(1-α/2) = t^2(n-2, 1-α/2) = F (1-α, 1, n-2)
卡方值在自由度為1的時候恰與Z平方相等!
這也是基本統計重要定理。
結論: 志願役酒駕比例顯著高於義務役,而且是非常顯著。
但是,糾~~竟有多顯著呢? 鍵盤統計將於之後的文章
整理型一誤、型二誤 (Type I,II Error) 與 α,β及p-value的
心得統整。
留言列表