Z - Statistics vs. t - Statistics

這一節我將確保我們理解了 z統計量和t統計量的區別推論統計中很多時候都是求得到一定樣本平均數的機率特別是樣本容量較大時我畫個抽樣分布假設這是樣本平均數的抽樣分布它具有某均值和標準差假設我們的樣本平均數在這裡我們希望知道得到至少這麽極端的結果的機率也就是求這個值以下的機率然後用1減去它或者說求這一部分面積這就需要求出該值離均值有多少個標準差遠這就需要求出該值離均值有多少個標準差遠做法是用樣本平均數減去實際均值做法是用樣本平均數減去實際均值這是我們假設的均值或者也許我們並不知道然後除以抽樣分布的標準差這是均值以上多少個標準差處也就是這個距離這個標準差我們一般都不知道中央極限定理告訴我們樣本容量充分時這個標準差等於總體標準差除以樣本容量的平方根這個標準差等於總體標準差除以樣本容量的平方根這個標準差等於總體標準差除以樣本容量的平方根於是我們的公式可以改寫爲樣本平均數-樣本平均數抽樣分布的均值除以這個即總體標準差σ除以根號下樣本容量n 這就是對離均值有多少標準差遠的最好度量了這就是對離均值有多少標準差遠的最好度量了這也就是我們之前講的z分數它由樣本平均數統計量推導出所以又稱爲z統計量它由樣本平均數統計量推導出所以又稱爲z統計量然後我們可以查z表格或者說正態分布表格然後我們可以查z表格或者說正態分布表格求得到這個z或更大的機率值也就是這個機率得到這種極端結果的機率也就是這個機率得到這種極端結果的機率不過在前幾個影片中我們看到總體標準差σ通常也是未知的因此需要估計於是我們說z統計量約等於… 因此需要估計於是我們說z統計量約等於… 分子照抄除以… 這裡改用樣本標準差作爲估計值除以… 這裡改用樣本標準差作爲估計值這在樣本容量n大於30時可行或者可以認爲 n>30時這將服從正態分布或者可以認爲 n>30時這將服從正態分布甚至這個估計情況都是近似正態分布的但如果樣本容量少於30 特別是比30小很多此時就不服從正態分布了特別是比30小很多此時就不服從正態分布了我重新寫一下這個表達式樣本平均數減去樣本平均數抽樣分布的均值除以樣本標準差除以根號下樣本容量我剛說了當n大於等於30時這個統計量將服從正態分布如果不是如此如果n較小則服從t分布此時一切照舊只是曲線不再是正態分布曲線在這裡曲線還是正態的 z服從正態分布而這裡是t分布這是一個標準化的t分布因爲我們減去了均值標準化t分布中均值是0 然後要找t值至少這麽極端的情況然後要找t值至少這麽極端的情況這裡是你得到的t值然後求出這一部分區域的面積計算此值的經驗法則很簡單計算此值的經驗法則很簡單如果樣本容量大於30 樣本標準差是很好的總體標準差估計值樣本標準差是很好的總體標準差估計值因此這整個就近似服從正態分布你可以用z表格查出至少得到這麽極端結果的機率如果樣本容量較小此時統計量將服從t分布如果樣本容量較小此時統計量將服從t分布此時就要用t表格來求t值至少這麽極端的機率以後我會講一些例子的但願這一節能解除你們對何時使用z統計量何時使用t統計量的疑惑