Reference: PTT joke 17545
或參考下面連結:
http://www.ptt.cc/bbs/joke/M.1343223089.A.39E.html
偏財運對我來說根本就跟絕緣體沒有兩樣,不過,能夠學以致用也堪稱難能可貴啦啦啦~
我想用三部分來整理怡君跟雅婷之爭。
(1) 其實可以不做這部分,用屁眼看也知道差異顯著。
H0: 怡君,雅婷,其他非菜名比例為1:1:1
H1: 比例不全等
α=0.05
建立93-100八年來的樣本加總及估計值:
怡君 雅婷 其他非菜市場名 八年來的樣本數
Σ 1375 1730 646088 649193
Ei ------216397.67----------- 649193
X^2=1279823.1>> X^2, (0.95, df=2) = 5.991
Reject H0 差異達顯著
(2) 在八年來的樣本數中,揪~~~竟怡君跟雅婷的比例有沒有達顯著差異呢??
H0: 兩者比例相同
H1: 比例不同
α=0.05
建立兩者比例差的95%信賴區間
CI=(1375/649193-1730/649193)+-√[5.991x(1375*647818/649193^3+1730*647463/649193^3)]
[-0.000757,-0.000337] CI不包含0
因此 Reject H0, 怡君與雅婷兩個名字之比例達顯著差異。
(3) 直線迴歸部分,我不討論兩者間的逐年差值。在這裡令怡君為自變項X,雅婷為應變項Y。
SSx=30330.875; SSy=22429.5; SSxy=25828.25
相關係數高得嚇人XD r=0.9902 表示兩者在八年間呈高度直線正相關性
R^2=0.9805 雅婷之變異量有98.05%可由怡君變異量解釋
最小平方法得迴歸直線
y=70.15625+0.85x
固定其他變項情形下,怡君每增加1,雅婷只增加0.85
建構迴歸變異數分析(Regression ANOVA)
SV SS DF MS F
Regression SSy*r^2 1
Within SSy*(1-r^2) 6
Total
檢定迴歸係數 標準差Sb=0.049
H0: β=0
H1: β=/=0
α=0.05
t=(b-0)/Sb=0.85/0.049=17.347 > t0.975,6 = 2.4469
r之F值亦達顯著
結論: 八年之總樣本分析顯示,雅婷顯著高於怡君(II)。
但就迴歸直線分析來看,b值意涵為未來看好怡君可能較有利,
這部分與Ref的觀點相同(III)。XD
本篇鍵盤統計認為不考慮如讓幾分等其他不相關因素,
依舊持續看好雅婷勝出,除了雅婷顯著高於怡君(II)的理由外,
直線迴歸對於樣本外的預測效果有限,也許峰迴路轉又過了十年,
兩者間的關係會呈現如白海豚轉彎的S曲線,難以用直線迴歸來解釋。
別忘了,直線迴歸的重要假設之一就是自變項依變項"呈直線相關"。