close

一篇文章總是要有個足以開頭的起點。

但鳩竟~要從哪個部分說起呢?

在一份檢定開始前,虛無假說H0與對立假說H1就像

文章的開端。

Q:檢定均值μ是否>10

H0: 「期望」之「否定」事項, μ<=10

H1: 「期望」的事項, μ>10

α即為我們設定的檢定水準,常見的就是0.05,或0.01

β呢?? 看隨α設定之臨界值於對立假說的常態分佈圖中

之位置與機率分布而定。

大家都一定對下面的圖非常熟悉。

Fig.1      

(Fig.1)

換句話說,α、β均來自於自己的假設,那又代表甚麼意義呢?

                              接受            拒絕

虛無假設為真           正確      型一誤(Type I)

虛無假設為偽    型二誤(Type II)  正確

白話說,一隻羊被牧羊人誤認為狼,於是牧羊人賞了這隻羊一顆土豆。

該接受卻拒絕,牧羊人犯了型一誤;

一隻狼該餵土豆牧羊人卻放任牠幹掉牧場裡的羊,

牧羊人犯了型二誤。

型一誤又稱α-error,型二誤稱β-error,

而檢定力(power)即為1-β,即右下的表格:

當虛無假設為偽的時候,正確拒絕虛無假設的機率(百分比)。

但是型一誤就是α,型二誤就是β嗎?

就型二誤來說是正確的,但直接說型一誤就是α或p值並不正確。

我們得先回顧p值(p-value)的定義:H0假設為真的情形下,足以拒絕H0的最小顯著水準

換言之,p-value即為統計量在分布圖中所佔之累積機率。

Fig.2  

(Fig.2)

以開頭的例子而論,如果檢定值(此例為1.96)超過我們設定的檢定水準,

1.96>1.645,那我們就該拒絕之,

p-value=統計量右端機率=1-0.975=0.025

由上表說明,拒絕的情形下我們可能會犯了型一誤

換言之,0.025即為犯型一誤的機率,但,

可以說型一誤就是p-value嗎? 也不完全是!

α為我們自行設定的檢定水準,其為型一誤的容許上限值

統計量於此時我們便會"開始拒絕虛無假設",因此型一誤最大值

便是我們設定的α。但如果統計量在接受區(以此範例為臨界值左側),

型一誤該是p-value或α值呢? 抱歉,通通不是!

此時我們會接受虛無假設,這時可能犯的錯誤只有型二誤

是沒有機會犯型一誤的!

回到型二誤差,

在一份可信的檢定裡,檢力的大小亦非常重要,常用的量值為0.8以上,

β<=0.2。由圖一可以明白,當檢定水準α變小(臨界值往右移,增大),

β變大,而當α變大時,β變小。因此如何決定α與β,在試驗之前

就必須被仔細考慮。那有沒有辦法可以同時降低α與β呢??

在一常態分布母體中,如隨機抽出其中的樣本,這些樣本的排列將符合

均值為X_bar,變方為母體變方除以樣本數之值(σ^2/n)之常態分布。

(可參考統計錄II標準誤之定義)

http://gt7520.pixnet.net/blog/post/46248588

因此,樣本數愈大,變方將隨著n變大而愈小,

樣本之分布將更往均值收斂。

Fig.3  

(Fig.3)

自上述可知,並沒有方法能同時降低兩者,但

只要樣本數愈大,便可在固定α的情況下,使β變小提升檢力

在公衛或醫學領域中,敏感度(sensitivity)、特異度(specificity)、

偽陽性(F+)、偽陰性(F-)等亦為討論型一、型二誤差及p-value的重要

應用之一,有興趣可多加了解,相當受用!!


 


arrow
arrow
    全站熱搜

    gt7520 發表在 痞客邦 留言(1) 人氣()