統計錄IV--α、β、TypeI,II Error及p-value心得統整 @ 小和尚之綠滿窗

一篇文章總是要有個足以開頭的起點。

但鳩竟~要從哪個部分說起呢?

在一份檢定開始前，虛無假說H0與對立假說H1就像

文章的開端。

Q:檢定均值μ是否>10

H0: 「期望」之「否定」事項, μ<=10

H1: 「期望」的事項, μ>10

α即為我們設定的檢定水準，常見的就是0.05，或0.01

那β呢?? 看隨α設定之臨界值於對立假說的常態分佈圖中

之位置與機率分布而定。

大家都一定對下面的圖非常熟悉。

(Fig.1)

換句話說，α、β均來自於自己的假設，那又代表甚麼意義呢?

接受拒絕

虛無假設為真 正確型一誤(Type I)

虛無假設為偽 型二誤(Type II) 正確

白話說，一隻羊被牧羊人誤認為狼，於是牧羊人賞了這隻羊一顆土豆。

該接受卻拒絕，牧羊人犯了型一誤；

一隻狼該餵土豆牧羊人卻放任牠幹掉牧場裡的羊，

牧羊人犯了型二誤。

型一誤又稱α-error，型二誤稱β-error，

而檢定力(power)即為1-β，即右下的表格:

當虛無假設為偽的時候，正確拒絕虛無假設的機率(百分比)。

但是型一誤就是α，型二誤就是β嗎?

就型二誤來說是正確的，但直接說型一誤就是α或p值並不正確。

我們得先回顧p值(p-value)的定義：H0假設為真的情形下，足以拒絕H0的最小顯著水準，

換言之，p-value即為統計量在分布圖中所佔之累積機率。

(Fig.2)

以開頭的例子而論，如果檢定值(此例為1.96)超過我們設定的檢定水準，

1.96>1.645，那我們就該拒絕之，

p-value=統計量右端機率=1-0.975=0.025

由上表說明，拒絕的情形下我們可能會犯了型一誤，

換言之，0.025即為犯型一誤的機率，但，

可以說型一誤就是p-value嗎? 也不完全是!

α為我們自行設定的檢定水準，其為型一誤的容許上限值

統計量於此時我們便會"開始拒絕虛無假設"，因此型一誤最大值

便是我們設定的α。但如果統計量在接受區(以此範例為臨界值左側)，

型一誤該是p-value或α值呢? 抱歉，通通不是!

此時我們會接受虛無假設，這時可能犯的錯誤只有型二誤，

是沒有機會犯型一誤的!

回到型二誤差，

在一份可信的檢定裡，檢力的大小亦非常重要，常用的量值為0.8以上，

即β<=0.2。由圖一可以明白，當檢定水準α變小(臨界值往右移，增大)，

β變大，而當α變大時，β變小。因此如何決定α與β，在試驗之前

就必須被仔細考慮。那有沒有辦法可以同時降低α與β呢??

在一常態分布母體中，如隨機抽出其中的樣本，這些樣本的排列將符合

均值為X_bar，變方為母體變方除以樣本數之值(σ^2/n)之常態分布。

(可參考統計錄II標準誤之定義)

http://gt7520.pixnet.net/blog/post/46248588

因此，樣本數愈大，變方將隨著n變大而愈小，

樣本之分布將更往均值收斂。

(Fig.3)

自上述可知，並沒有方法能同時降低兩者，但

只要樣本數愈大，便可在固定α的情況下，使β變小提升檢力。

在公衛或醫學領域中，敏感度(sensitivity)、特異度(specificity)、

偽陽性(F+)、偽陰性(F-)等亦為討論型一、型二誤差及p-value的重要

應用之一，有興趣可多加了解，相當受用!!

gt7520

小和尚之綠滿窗

gt7520 發表在痞客邦留言(1) 人氣()

E-mail轉寄

小和尚之綠滿窗

ͼ鍵盤ͽ҉ͼ分析ͽ

統計錄IV--α、β、TypeI,II Error及p-value心得統整

歷史上的今天

留言列表

站方公告

活動快報

痞客邦...

我的好友

熱門文章

文章分類

最新文章

最新留言

動態訂閱

文章精選

文章搜尋

新聞交換(RSS)

誰來我家

參觀人氣

QR Code

POWERED BY