Expected Value of Binomial Distribution

上一节我讲到了随机变量期望值本字幕由网易公开课提供，更多课程请到http//open.163.com 上一节我讲到了随机变量期望值其实也就是总体均值只是随机变量的总体是无穷的无法全部求和然后取平均值于是我们需要用到频率进行加权平均网易公开课官方微博 http://t.163.com/163open 于是我们需要用到频率进行加权平均于是我们需要用到频率进行加权平均这同老式的求平均方法其实没有本质区别这同老式的求平均方法其实没有本质区别但是可以用于求随机变量无穷总体的均值但是可以用于求随机变量无穷总体的均值 oCourse字幕组翻译：只做公开课的字幕组 http://ocourse.org 随机变量总体无穷是因为可以无止尽进行试验随机变量总体无穷是因为可以无止尽进行试验然后我们计算了二项分布的期望值然后我们计算了二项分布的期望值当时是以抛硬币为例这一节我将讲到二项分布期望值的一般公式这一节我将讲到二项分布期望值的一般公式假设有随机变量X 表示n次试验成功的次数其中每次成功的概率是p 表示n次试验成功的次数其中每次成功的概率是p 这是更一般的情况比如正面可以看作是成功这是更一般的情况比如正面可以看作是成功而概率p是0.5 n是10次这里只是更一般化了而概率p是0.5 n是10次这里只是更一般化了而概率p是0.5 n是10次这里只是更一般化了然后求这个X的期望值这个随机变量的概率分布将是很好的二项分布这个随机变量的概率分布将是很好的二项分布看起来有些像钟形曲线以后我们会更详细学到钟形曲线首先我打算给出答案答案其实很直观随机变量X的期望值是n?p 有时也写成p?n 随机变量X的期望值是n?p 有时也写成p?n 我讲得更明白一些先换个颜色我讲得更明白一些先换个颜色 X表示投进篮筐的次数 X表示投进篮筐的次数 10次投篮后进球的次数每一次进球的概率是40% 投10次命中率40% 那么表示进球次数的随机变量X 投10次命中率40% 那么表示进球次数的随机变量X 其期望值就等于此命中率乘以投篮次数其期望值就等于此命中率乘以投篮次数也就是40%×10 也就是4 也就是40%×10 也就是4 当然期望值并不一定是可能性最大的那个值当然期望值并不一定是可能性最大的那个值因为概率分布可能会很怪因为概率分布可能会很怪不过在二项分布中期望值可以看成是最可能得到的那个结果期望值可以看成是最可能得到的那个结果 40%命中率投10次最可能的结果是中4次也可能进6次或3次但4次的可能性最大也可能进6次或3次但4次的可能性最大我一般是这样理解这个期望值的即每一次投篮有40%的几率命中可以理解为投篮总是中40% 那么投10次自然是4次投中可以这样来理解这个期望值可以这样来理解这个期望值下面来证明一下这就是二项分布的期望值下面来证明一下这就是二项分布的期望值想想二项分布中 X=k的概率是多少想想二项分布中 X=k的概率是多少我还是用这个篮球的例子来讲解我还是用这个篮球的例子来讲解 k可以是投中3次或者多少次 k可以是投中3次或者多少次 k可以是投中3次或者多少次 n次投篮从中选k n次投篮从中选k 之前我们做过很多了后面还要乘以每一种基本情况的概率后面还要乘以每一种基本情况的概率基本情况也就是中k次不中n-k次于是需要乘以命中率p的k次方 p自乘k次这是命中k次还需要射失剩下的n-k次射失的概率是1-p 还需要射失剩下的n-k次射失的概率是1-p 命中k次射失次数就必然是n-k次命中k次射失次数就必然是n-k次命中k次射失次数就必然是n-k次总的来说这就是二项分布中成功k次的概率总的来说这就是二项分布中成功k次的概率我们知道随机变量的期望值是概率加权平均值我们知道随机变量的期望值是概率加权平均值我们知道随机变量的期望值是概率加权平均值我可不希望这一节让你们感到迷惑这一节至少需要记住这个就够了这一节至少需要记住这个就够了后面的技术性比较强不过能够帮助熟悉Σ等符号同时也是对二项式系数的复习同时也是对二项式系数的复习总之期望值就是这些经过概率加权之后的和总之期望值就是这些经过概率加权之后的和也就是将X=k的概率乘以k 然后全部加起来也就是将X=k的概率乘以k 然后全部加起来对每一个k 所以二项分布的随机变量X 其期望值是所以二项分布的随机变量X 其期望值是求和 k从0一直到n 投篮中表示不中到全中 k从0一直到n 投篮中表示不中到全中 k从0一直到n 投篮中表示不中到全中每一个求和项是结果k乘以k次投中的概率每一个求和项是结果k乘以k次投中的概率 k次投中的概率也就是这个 k次投中的概率也就是这个即k乘以n选k乘以p的k次方乘以1-p的n-k次方即k乘以n选k乘以p的k次方乘以1-p的n-k次方然后进行一些代数求和运算然后进行一些代数求和运算首先我们可以这样处理一下这个求和式首先我们可以这样处理一下这个求和式第一项的k=0 第一项的k=0 所以第一项整个为0 这一项对求和没有贡献这一项对求和没有贡献整个求和式可以写成 0乘以n选0乘以p的0次方乘以1-p的n-0次方 0乘以n选0乘以p的0次方乘以1-p的n-0次方加0乘以n选1乘以p的1次方乘以1-p的n-1次方加0乘以n选1乘以p的1次方乘以1-p的n-1次方一直加下去直到k=n为止也就是n乘以n选n乘以p的n次方乘以1-p的n-n次方也就是n乘以n选n乘以p的n次方乘以1-p的n-n次方这是求和的展开式这第一项为0 因为k=0 0乘以任何数为0 这第一项为0 因为k=0 0乘以任何数为0 这第一项为0 因为k=0 0乘以任何数为0 因此这一项可以在求和过程中忽略求和可以写成这个形式这和上面的求和是一样的这和上面的求和是一样的随机变量的期望值就是这个和 k不需要从0开始从1开始即可 k=1一直到n k乘以n选k 乘以p的k次方乘以1-p的n-k次方以上只是将第一项去掉了以上只是将第一项去掉了这对后面的化简很有用处这对后面的化简很有用处下面把二项式系数写出来下面把二项式系数写出来哦我的iPod同步弹出来了关掉它然后回来下面把二项式系数写出来下面把二项式系数写出来 k从1到n k乘以n!/[k!(n-k)!] k乘以n!/[k!(n-k)!] 乘以p的k次方乘以1-p的n-k次方这里k/k!还可以进行一些化简这里k/k!还可以进行一些化简我可以重写一下k! k!也就是k?(k-1)?(k-2)…一直乘到1 k!也就是k?(k-1)?(k-2)…一直乘到1 k!也就是k?(k-1)! 因为这是k乘以k-1一直到1 因为这是k乘以k-1一直到1 这个可以重写为k?(k-1)! 这样k和k就可以消掉这样k和k就可以消掉于是整个式子又可以重写于是整个式子又可以重写这样就得到求和 k从1到n n!/[(k-1)!(n-k)!] 求和 k从1到n n!/[(k-1)!(n-k)!] 乘以p的k次方乘以1-p的n-k次方继续进行化简最后我们要化简成np 继续进行化简最后我们要化简成np 继续进行化简最后我们要化简成np 我们可以提出一个np来然后看其它东西能否得到1 n!可以用上面的技巧 n!可以写成n?(n-1)! 而p的k次方可以写成p乘p的k-1次方然后可以提出n和p 有np乘以求和 k从1到n 后面是(n-1)!/[(k-1)!(n-k)!] 后面是(n-1)!/[(k-1)!(n-k)!] 乘以p的k-1次方乘以1-p的n-k次方乘以p的k-1次方乘以1-p的n-k次方我们希望期望值是np 也就是说上面这个式子应该等于这个所以最终目的是让这个求和式等于1 为了实现这个目的我将进行换元令a=k-1 令a=k-1 b=n-1 那么n-k等于多少 a=k-1 则a+1=k 然后b+1=n 那么n-k=a+1-(b+1)=a-b 然后b+1=n 那么n-k=a+1-(b+1)=a-b 然后b+1=n 那么n-k=a+1-(b+1)=a-b 继续化简有np乘以整个和继续化简有np乘以整个和 k从1到n k=1时 a等于0 k=n时 a=n-1 所以a是从0到n-1 k=n时 a=n-1 所以a是从0到n-1 k=n时 a=n-1 所以a是从0到n-1 k=n时 a=n-1 所以a是从0到n-1 而n-1又等于b 所以a是从0到b 有点绕你可以停下来琢磨琢磨我已经超时了必须得加快 b=n-1 所以有b! 除以k-1的阶乘这也就是a! 然后n-k=… 我写反了应该是b-a 然后n-k=… 我写反了应该是b-a n-k=b+1-(a+1)=b-a n-k=b+1-(a+1)=b-a 所以这里是(b-a)! 后面是p的k-1次方也就是p的a次方乘以1-p的n-k次方仍然有n-k=b-a 基本完成这个是什么基本完成这个是什么我以一种更简单的方式重写一下这等于npΣ… a从0到b 其中这是b选a 从b中选a的不同选法种数其中这是b选a 从b中选a的不同选法种数乘以p的a次方乘以1-p的b-a次方这是什么这里是对二项分布的每一项求和比如a=0的概率是多少这是每一种a值的概率然后把所有放到一起求和我简单画个图 a=0的概率是这么多 a=1时是另外一个概率一直下去越来越高 a=1时是另外一个概率一直下去越来越高最后得到一个接近钟形曲线的形状这一项对应于每一个概率每个长方形代表这其中一项 a=0对应第一项 a=1对应第二项 a=2对应第三项一直到a=b 所有这些相加这些都是概率值这相当于随机变量取到任意一个值的概率随机变量取到任意某个值的概率也就是所有可能的概率加起来结果肯定等于1 以投硬币为例以投硬币为例这等于0次正面的概率+1次正面概率这等于0次正面的概率+1次正面概率加2次正面的概率+3次正面的概率一直加到b次正面的概率所有情况中任意一种发生的概率也就是整个概率分布上的和也就是1 也就是整个概率分布上的和也就是1 这样随机变量X的期望值就是np了这样随机变量X的期望值就是np了其中n是试验次数 p是每次成功的概率其中n是试验次数 p是每次成功的概率该公式只针对二项分布不针对其它分布的随机变量该公式只针对二项分布不针对其它分布的随机变量只对二项分布的随机变量X成立只对二项分布的随机变量X成立这次超时太多了下次见