Tip:
Highlight text to annotate it
X
這一節我將確保我們理解了
z統計量和t統計量的區別
推論統計中很多時候
都是求得到一定樣本平均數的機率
特別是樣本容量較大時
我畫個抽樣分布
假設這是樣本平均數的抽樣分布
它具有某均值和標準差
假設我們的樣本平均數在這裡 我們希望知道
得到至少這麽極端的結果的機率
也就是求這個值以下的機率
然後用1減去它 或者說求這一部分面積
這就需要求出該值離均值有多少個標準差遠
這就需要求出該值離均值有多少個標準差遠
做法是 用樣本平均數減去實際均值
做法是 用樣本平均數減去實際均值
這是我們假設的均值 或者也許我們並不知道
然後除以抽樣分布的標準差
這是均值以上多少個標準差處
也就是這個距離
這個標準差我們一般都不知道
中央極限定理告訴我們 樣本容量充分時
這個標準差等於總體標準差除以樣本容量的平方根
這個標準差等於總體標準差除以樣本容量的平方根
這個標準差等於總體標準差除以樣本容量的平方根
於是我們的公式可以改寫爲
樣本平均數-樣本平均數抽樣分布的均值
除以這個
即總體標準差σ除以根號下樣本容量n
這就是對離均值有多少標準差遠的最好度量了
這就是對離均值有多少標準差遠的最好度量了
這也就是我們之前講的z分數
它由樣本平均數統計量推導出 所以又稱爲z統計量
它由樣本平均數統計量推導出 所以又稱爲z統計量
然後我們可以查z表格 或者說正態分布表格
然後我們可以查z表格 或者說正態分布表格
求得到這個z或更大的機率值
也就是這個機率 得到這種極端結果的機率
也就是這個機率 得到這種極端結果的機率
不過在前幾個影片中 我們看到
總體標準差σ通常也是未知的
因此需要估計 於是我們說z統計量約等於…
因此需要估計 於是我們說z統計量約等於…
分子照抄
除以… 這裡改用樣本標準差作爲估計值
除以… 這裡改用樣本標準差作爲估計值
這在樣本容量n大於30時可行
或者可以認爲 n>30時 這將服從正態分布
或者可以認爲 n>30時 這將服從正態分布
甚至這個估計情況都是近似正態分布的
但如果樣本容量少於30
特別是比30小很多 此時就不服從正態分布了
特別是比30小很多 此時就不服從正態分布了
我重新寫一下這個表達式
樣本平均數減去樣本平均數抽樣分布的均值除以
樣本標準差除以根號下樣本容量
我剛說了 當n大於等於30時
這個統計量將服從正態分布
如果不是如此 如果n較小 則服從t分布
此時一切照舊
只是曲線不再是正態分布曲線
在這裡 曲線還是正態的
z服從正態分布
而這裡是t分布 這是一個標準化的t分布
因爲我們減去了均值
標準化t分布中 均值是0
然後要找t值至少這麽極端的情況
然後要找t值至少這麽極端的情況
這裡是你得到的t值
然後求出這一部分區域的面積
計算此值的經驗法則很簡單
計算此值的經驗法則很簡單
如果樣本容量大於30
樣本標準差是很好的總體標準差估計值
樣本標準差是很好的總體標準差估計值
因此這整個就近似服從正態分布
你可以用z表格查出至少得到這麽極端結果的機率
如果樣本容量較小 此時統計量將服從t分布
如果樣本容量較小 此時統計量將服從t分布
此時就要用t表格
來求t值至少這麽極端的機率
以後我會講一些例子的
但願這一節能解除
你們對何時使用z統計量 何時使用t統計量的疑惑