Tip:
Highlight text to annotate it
X
上一節 我們求出了低脂組和對照組
本字幕由網易公開課提供,更多課程請到http//open.163.com
減肥效果均值之差的95%信賴區間
這一節 我要用假設檢定來檢驗這些數據
能否讓我們相信低脂節食有效
網易公開課官方微博 http://t.163.com/163open
首先還是要設定零假設和備擇假設
零假設是 低脂節食方式沒有作用
oCourse字幕組翻譯:只做公開課的字幕組 http://ocourse.org
也就是說 低脂組的總體均值-對照組的總體均值=0
也就是說 低脂組的總體均值-對照組的總體均值=0
也就是說 低脂組的總體均值-對照組的總體均值=0
這完全等價於
低脂組抽樣分布的均值-對照組抽樣分布的均值=0
低脂組抽樣分布的均值-對照組抽樣分布的均值=0
我們見過很多次了
抽樣分布的均值等價於總體的均值
這個等於這個 那個等於那個
這也就等價於
樣本平均數之差的分布的均值=0 這是我們上一節所關注的
樣本平均數之差的分布的均值=0 這是我們上一節所關注的
因爲這個等價於這個
這就是零假設 再看備擇假設
備擇假設也就是說這種低脂方式有效 或者說比一般方式有改進
備擇假設也就是說這種低脂方式有效 或者說比一般方式有改進
即減肥效果更好
也就是第一組的總體均值-第二組的總體均值>0
也就是第一組的總體均值-第二組的總體均值>0
這是一個單側檢定
這也可以寫成是 樣本平均數之差的分布的均值>0
這也可以寫成是 樣本平均數之差的分布的均值>0
這是等價的 因爲這等價於這
也就等於這個 也就是我寫的這個
任何假設檢定 都有一定顯著性水平
然後我們要假設零假設正確
然後在零假設成立的前提下
我們將求出得到這個樣本數據的機率
如果機率少於某一界極極限值
我們就將拒絕零假設 接受備擇假設
這個界極極限值我們見過 稱爲顯著性水平 有時記作α
這個界極極限值我們見過 稱爲顯著性水平 有時記作α
譯者注:顯著性水平α應該等於5%
也就是說 在零假設正確的前提下
我們希望得到這個結果的幾率少於5%
或者說拒絕正確零假設的幾率只有5%
也就是犯第一型錯誤的機率是5%
如果得到這個的機率少於5%
我們就將拒絕零假設
零假設前提下得到這個結果的機率少於5%
我們就將拒絕零假設 接受備擇假設
具體來看看 假設零假設成立
我畫一個分布圖
零假設表示 抽樣分布之差的均值等於0
零假設表示 抽樣分布之差的均值等於0
此時 臨界值在什麽地方呢
我們需要一個臨界值
不說z值 是因爲這不是標準化正態分布
這裡存在一個臨界值
統計中最難做到的就是措辭正確
這裡存在某個臨界值 超過此值的機率只有5%
這裡存在某個臨界值 超過此值的機率只有5%
我們要求出這個臨界值是什麽
如果我們的值大於這個臨界值 那麽我們將拒絕零假設
因爲這意味著得到這個的機率少於5%
我們拒絕零假設 接受備擇假設
我們可以使用z分數 我們可以假定這裡是正態分布
因爲這裡的樣本容量足夠大
兩個分布的樣本容量都是100 我們可以通過查表來求
首先假設有一個標準化總體分布 求出臨界z值
這裡需要該z值以上的機率只有5%
由於表中是累積機率 所以要看這個95%的區域面積
下面要從z表格中找這個95%對應的值
這裡是一側的情況 找找95% 這裡是最接近的
稍微往右一點的值更好一些
這裡95.05%很接近 對應1.65
因此臨界z值是1.65
也就是說 這裡離中間是1.65個標準差遠
寫得有點小 這裡是該分布的標準差
該標準差等於多少呢
上一節我算過 這裡我重新算一下
樣本平均數之差的分布 其標準差
等於根號下 第一個總體的方差…
第一個總體的方差未知 不過我們可以用樣本標準差進行估計
第一個總體的方差未知 不過我們可以用樣本標準差進行估計
樣本標準差4.67的平方也就是樣本變異數
樣本標準差4.67的平方也就是樣本變異數
這就得到了總體方差的最好估計值
之後還要除以樣本容量
之後加上 第二組總體方差的最好估計值 即4.042
之後加上 第二組總體方差的最好估計值 即4.042
其中4.04是第二組的樣本標準差
然後還要除以樣本容量100
上一節我算過 計算器上可能還有
確實還在 也就是這個值
4.672/100+4.042/100
這裡的結果是0.617
因此這個距離是1.65×0.617
算一下 0.617×1.65
結果是1.02 這個距離是1.02
也就是說 如果假設低脂節食毫無改善
兩個樣本平均數之差超過1.02的機率只有5%
兩個樣本平均數之差超過1.02的機率只有5%
而實際我們得到的差值是1.91
大概在這附近 這顯然落在臨界值之外
零假設前提下 得到這個的機率少於5%
這裡的機率水平比顯著性水平要低 我澄清一下
顯著性水平α 應該是5%
不是95% 我應該沒說錯 只是不小心寫錯了
不小心就用1減去了5%
這裡顯著性水平是5%
在零假設成立的前提下
得到這個差值的機率少於我們的顯著性水平
得到這個差值的機率少於我們的顯著性水平
少於5% 根據我們制定的規則
根據5%顯著性水平 我們將拒絕零假設
接受備擇假設 即低脂節食方式確實能幫助減去更多體重