close

Reference: PTT joke 17545

或參考下面連結:

http://www.ptt.cc/bbs/joke/M.1343223089.A.39E.html

偏財運對我來說根本就跟絕緣體沒有兩樣,不過,能夠學以致用也堪稱難能可貴啦啦啦~

我想用三部分來整理怡君跟雅婷之爭。

(1) 其實可以不做這部分,用屁眼看也知道差異顯著。

H0: 怡君,雅婷,其他非菜名比例為1:1:1

H1: 比例不全等                     

α=0.05

建立93-100八年來的樣本加總及估計值:

       怡君     雅婷   其他非菜市場名    八年來的樣本數

  Σ  1375   1730      646088             649193

Ei   ------216397.67-----------            649193

X^2=1279823.1>> X^2, (0.95, df=2) = 5.991

Reject H0 差異達顯著

(2) 在八年來的樣本數中,揪~~~竟怡君跟雅婷的比例有沒有達顯著差異呢??

H0: 兩者比例相同

H1: 比例不同

α=0.05

建立兩者比例差的95%信賴區間

CI=(1375/649193-1730/649193)+-√[5.991x(1375*647818/649193^3+1730*647463/649193^3)]

[-0.000757,-0.000337] CI不包含0 

因此 Reject H0, 怡君與雅婷兩個名字之比例達顯著差異。

(3) 直線迴歸部分,我不討論兩者間的逐年差值。在這裡令怡君為自變項X,雅婷為應變項Y。

SSx=30330.875; SSy=22429.5; SSxy=25828.25

相關係數高得嚇人XD r=0.9902 表示兩者在八年間呈高度直線正相關性

R^2=0.9805 雅婷之變異量有98.05%可由怡君變異量解釋

最小平方法得迴歸直線

y=70.15625+0.85x 

固定其他變項情形下,怡君每增加1,雅婷只增加0.85

建構迴歸變異數分析(Regression ANOVA)

    SV                  SS                  DF          MS        F

Regression    SSy*r^2              1

 Within          SSy*(1-r^2)         6

 Total

檢定迴歸係數 標準差Sb=0.049

H0: β=0

H1: β=/=0

α=0.05

t=(b-0)/Sb=0.85/0.049=17.347 > t0.975,6 = 2.4469

r之F值亦達顯著

結論: 八年之總樣本分析顯示,雅婷顯著高於怡君(II)。

        但就迴歸直線分析來看,b值意涵為未來看好怡君可能較有利,

        這部分與Ref的觀點相同(III)。XD

        本篇鍵盤統計認為不考慮如讓幾分等其他不相關因素,

        依舊持續看好雅婷勝出,除了雅婷顯著高於怡君(II)的理由外,

        直線迴歸對於樣本外的預測效果有限,也許峰迴路轉又過了十年,

        兩者間的關係會呈現如白海豚轉彎的S曲線,難以用直線迴歸來解釋。

        別忘了,直線迴歸的重要假設之一就是自變項依變項"呈直線相關"。

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 gt7520 的頭像
    gt7520

    小和尚之綠滿窗

    gt7520 發表在 痞客邦 留言(0) 人氣()