close

兩比例差異檢定就實務面上其實有相當多可以討論的主題。

採自PTT Militarylife 15452摘錄內容:

「國軍99年度判決確定167人中,以階級結構區分,校官合計20人,占12%;尉官合計13
人,占7.8%;士官合計73人,占43.7%;士兵合計61人,占36.5%,其中以士官犯罪占
最多數;若以領導職之軍士官犯罪計算,總計高達106人(占63.5%),可見酒後駕車犯
罪多存在於基層領導幹部。

若以役別結構區分,

志願役130人(占77.8%),義務役37人(占22.2%)。」

本篇鍵盤分析並無對役別存在特定偏見,

統計方法實際上亦非科學評析的唯一方式。

而放大字體則為本篇討論重點: 

鳩~~~竟,志願役酒駕比例在統計意義上是否顯著高於義務役呢??

先回顧一個兩比例Z檢定 (two-proportional Z-test) 的例子:

給Q牌DNA Extraction kit 120mg的粗萃取 (crude extract),

給G牌類似功能之kit 150mg粗萃取。

已知兩份粗萃取實際上均含100mg的DNA,

elute後之結果,Q得到80mg,G拿到70mg,

檢定兩者之DNA萃取比例是否相同?

令PQ為Q牌萃取比;PG為G牌萃取比。

H0: PQ=PG  

H1: PQ與PG不相等

α=0.05

建構2X2表格如下:

             Q      G      T

萃取      80    70    150

未萃取   20    30      50

   T      100  100   200

Zα=(80/100-70/100)/(√[2*(1/100)*(150/200)*(50/200)])=1.633

<Z0.975=1.96  

Accept H0 無法說Q牌之萃取率確實比G牌優異,即便檢定標的改為單尾:

H0: PQ<=PG

H1: PQ>PG

Z0.95=1.645。

回到討論的主題,可發現2X2表格難以建立,因為實際上只有2X1。

役別    志願役 義務役   T

酒駕     130     37     167

是不是把2X2表轉成如下的2X1呢?

             Q      G      T                              萃取  未萃取    T

萃取      80    70    150           或       Q     80     20      100

好。因此分母的標準差勢必有所不同。我們可以先建構一個無母數的卡方檢定。

這裡的卡方為什麼是無母數呢? 因為我們不需要用到任何母數,即均值及標準差,

只需了解觀察值與估計值即可。

H0: 兩種役別酒駕情形相同

H1: 酒駕情形不同  α=0.05

 

    役別               志願役 義務役   T

酒駕觀察值(Oi)     130     37     167

       估計值(Ei)         83.5     83.5     167

X^2=Σ[(|Oi-Ei|-0.5)^2 / Ei]=50.68 >> X^2 (0.95 DF=1)=3.84

Reject H0 達顯著差異,志願役酒駕情形確實比義務役嚴重。

0.5的扣減值為DF=1卡方檢定的葉式連續校正(Yates Correction)結果。

實務上,如果卡方數值大,則校不校正沒有太大差異,因為這是

防止數值過小的校正方式。(原諒小的不學無術,無法就此做詳細說明)

 

以比例法,虛無假設建構同上述卡方。

令 Pa = 志願役酒駕比例、Pb = 義務役酒駕比例

H0:兩種役別酒駕情形相同 (Pa=Pb=P0=0.5)

 

H1: 酒駕情形不同  α=0.05

因此,標準差應為:√[0.5^2/167]=0.0387 

Zα=(p-p0)/√[(p0^2)/n]說明,p0為虛無假設之0.5,為真則兩種役別酒駕能力一樣好(廢話)

Zα=(130/167-83.5/167)/σ = 0.557/0.0387 = 7.19 >> Z0.95 & Z0.975

即不論單尾(懶惰不寫了)或雙尾,志願役酒駕比例皆顯著大於義務役。

好。紅色數值又表示甚麼意義呢?? 

X^2(1,1-α) = Z^2(1-α/2) = t^2(n-2, 1-α/2) = F (1-α, 1, n-2)

卡方值在自由度為1的時候恰與Z平方相等!

這也是基本統計重要定理。

結論: 志願役酒駕比例顯著高於義務役,而且是非常顯著。

       但是,糾~~竟有多顯著呢? 鍵盤統計將於之後的文章

       整理型一誤、型二誤 (Type I,II Error) 與 α,β及p-value的

          心得統整。

 

arrow
arrow
    全站熱搜

    gt7520 發表在 痞客邦 留言(2) 人氣()