Z - Statistics vs. t - Statistics

这一节我将确保我们理解了 z统计量和t统计量的区别推论统计中很多时候都是求得到一定样本均值的概率特别是样本容量较大时我画个抽样分布假设这是样本均值的抽样分布它具有某均值和标准差假设我们的样本均值在这里我们希望知道得到至少这么极端的结果的概率也就是求这个值以下的概率然后用1减去它或者说求这一部分面积这就需要求出该值离均值有多少个标准差远这就需要求出该值离均值有多少个标准差远做法是用样本均值减去实际均值做法是用样本均值减去实际均值这是我们假设的均值或者也许我们并不知道然后除以抽样分布的标准差这是均值以上多少个标准差处也就是这个距离这个标准差我们一般都不知道中心极限定理告诉我们样本容量充分时这个标准差等于总体标准差除以样本容量的平方根这个标准差等于总体标准差除以样本容量的平方根这个标准差等于总体标准差除以样本容量的平方根于是我们的公式可以改写为样本均值-样本均值抽样分布的均值除以这个即总体标准差σ除以根号下样本容量n 这就是对离均值有多少标准差远的最好度量了这就是对离均值有多少标准差远的最好度量了这也就是我们之前讲的z分数它由样本均值统计量推导出所以又称为z统计量它由样本均值统计量推导出所以又称为z统计量然后我们可以查z表格或者说正态分布表格然后我们可以查z表格或者说正态分布表格求得到这个z或更大的概率值也就是这个概率得到这种极端结果的概率也就是这个概率得到这种极端结果的概率不过在前几个视频中我们看到总体标准差σ通常也是未知的因此需要估计于是我们说z统计量约等于… 因此需要估计于是我们说z统计量约等于… 分子照抄除以… 这里改用样本标准差作为估计值除以… 这里改用样本标准差作为估计值这在样本容量n大于30时可行或者可以认为 n>30时这将服从正态分布或者可以认为 n>30时这将服从正态分布甚至这个估计情况都是近似正态分布的但如果样本容量小于30 特别是比30小很多此时就不服从正态分布了特别是比30小很多此时就不服从正态分布了我重新写一下这个表达式样本均值减去样本均值抽样分布的均值除以样本标准差除以根号下样本容量我刚说了当n大于等于30时这个统计量将服从正态分布如果不是如此如果n较小则服从t分布此时一切照旧只是曲线不再是正态分布曲线在这里曲线还是正态的 z服从正态分布而这里是t分布这是一个标准化的t分布因为我们减去了均值标准化t分布中均值是0 然后要找t值至少这么极端的情况然后要找t值至少这么极端的情况这里是你得到的t值然后求出这一部分区域的面积计算此值的经验法则很简单计算此值的经验法则很简单如果样本容量大于30 样本标准差是很好的总体标准差估计值样本标准差是很好的总体标准差估计值因此这整个就近似服从正态分布你可以用z表格查出至少得到这么极端结果的概率如果样本容量较小此时统计量将服从t分布如果样本容量较小此时统计量将服从t分布此时就要用t表格来求t值至少这么极端的概率以后我会讲一些例子的但愿这一节能解除你们对何时使用z统计量何时使用t统计量的疑惑