Tip:
Highlight text to annotate it
X
这一节我将确保我们理解了
z统计量和t统计量的区别
推论统计中很多时候
都是求得到一定样本均值的概率
特别是样本容量较大时
我画个抽样分布
假设这是样本均值的抽样分布
它具有某均值和标准差
假设我们的样本均值在这里 我们希望知道
得到至少这么极端的结果的概率
也就是求这个值以下的概率
然后用1减去它 或者说求这一部分面积
这就需要求出该值离均值有多少个标准差远
这就需要求出该值离均值有多少个标准差远
做法是 用样本均值减去实际均值
做法是 用样本均值减去实际均值
这是我们假设的均值 或者也许我们并不知道
然后除以抽样分布的标准差
这是均值以上多少个标准差处
也就是这个距离
这个标准差我们一般都不知道
中心极限定理告诉我们 样本容量充分时
这个标准差等于总体标准差除以样本容量的平方根
这个标准差等于总体标准差除以样本容量的平方根
这个标准差等于总体标准差除以样本容量的平方根
于是我们的公式可以改写为
样本均值-样本均值抽样分布的均值
除以这个
即总体标准差σ除以根号下样本容量n
这就是对离均值有多少标准差远的最好度量了
这就是对离均值有多少标准差远的最好度量了
这也就是我们之前讲的z分数
它由样本均值统计量推导出 所以又称为z统计量
它由样本均值统计量推导出 所以又称为z统计量
然后我们可以查z表格 或者说正态分布表格
然后我们可以查z表格 或者说正态分布表格
求得到这个z或更大的概率值
也就是这个概率 得到这种极端结果的概率
也就是这个概率 得到这种极端结果的概率
不过在前几个视频中 我们看到
总体标准差σ通常也是未知的
因此需要估计 于是我们说z统计量约等于…
因此需要估计 于是我们说z统计量约等于…
分子照抄
除以… 这里改用样本标准差作为估计值
除以… 这里改用样本标准差作为估计值
这在样本容量n大于30时可行
或者可以认为 n>30时 这将服从正态分布
或者可以认为 n>30时 这将服从正态分布
甚至这个估计情况都是近似正态分布的
但如果样本容量小于30
特别是比30小很多 此时就不服从正态分布了
特别是比30小很多 此时就不服从正态分布了
我重新写一下这个表达式
样本均值减去样本均值抽样分布的均值除以
样本标准差除以根号下样本容量
我刚说了 当n大于等于30时
这个统计量将服从正态分布
如果不是如此 如果n较小 则服从t分布
此时一切照旧
只是曲线不再是正态分布曲线
在这里 曲线还是正态的
z服从正态分布
而这里是t分布 这是一个标准化的t分布
因为我们减去了均值
标准化t分布中 均值是0
然后要找t值至少这么极端的情况
然后要找t值至少这么极端的情况
这里是你得到的t值
然后求出这一部分区域的面积
计算此值的经验法则很简单
计算此值的经验法则很简单
如果样本容量大于30
样本标准差是很好的总体标准差估计值
样本标准差是很好的总体标准差估计值
因此这整个就近似服从正态分布
你可以用z表格查出至少得到这么极端结果的概率
如果样本容量较小 此时统计量将服从t分布
如果样本容量较小 此时统计量将服从t分布
此时就要用t表格
来求t值至少这么极端的概率
以后我会讲一些例子的
但愿这一节能解除
你们对何时使用z统计量 何时使用t统计量的疑惑