Tip:
Highlight text to annotate it
X
上一节 我讲到了随机变量期望值
本字幕由网易公开课提供,更多课程请到http//open.163.com
上一节 我讲到了随机变量期望值
其实也就是总体均值
只是随机变量的总体是无穷的
无法全部求和然后取平均值
于是我们需要用到频率进行加权平均
网易公开课官方微博 http://t.163.com/163open
于是我们需要用到频率进行加权平均
于是我们需要用到频率进行加权平均
这同老式的求平均方法其实没有本质区别
这同老式的求平均方法其实没有本质区别
但是可以用于求随机变量无穷总体的均值
但是可以用于求随机变量无穷总体的均值
oCourse字幕组翻译:只做公开课的字幕组 http://ocourse.org
随机变量总体无穷是因为可以无止尽进行试验
随机变量总体无穷是因为可以无止尽进行试验
然后 我们计算了二项分布的期望值
然后 我们计算了二项分布的期望值
当时是以抛硬币为例
这一节我将讲到二项分布期望值的一般公式
这一节我将讲到二项分布期望值的一般公式
假设有随机变量X
表示n次试验成功的次数 其中每次成功的概率是p
表示n次试验成功的次数 其中每次成功的概率是p
这是更一般的情况 比如正面可以看作是成功
这是更一般的情况 比如正面可以看作是成功
而概率p是0.5 n是10次 这里只是更一般化了
而概率p是0.5 n是10次 这里只是更一般化了
而概率p是0.5 n是10次 这里只是更一般化了
然后求这个X的期望值
这个随机变量的概率分布将是很好的二项分布
这个随机变量的概率分布将是很好的二项分布
看起来有些像钟形曲线
以后我们会更详细学到钟形曲线
首先 我打算给出答案
答案其实很直观
随机变量X的期望值是n?p 有时也写成p?n
随机变量X的期望值是n?p 有时也写成p?n
我讲得更明白一些 先换个颜色
我讲得更明白一些 先换个颜色
X表示投进篮筐的次数
X表示投进篮筐的次数
10次投篮后进球的次数
每一次进球的概率是40%
投10次 命中率40% 那么表示进球次数的随机变量X
投10次 命中率40% 那么表示进球次数的随机变量X
其期望值就等于此命中率乘以投篮次数
其期望值就等于此命中率乘以投篮次数
也就是40%×10 也就是4
也就是40%×10 也就是4
当然 期望值并不一定是可能性最大的那个值
当然 期望值并不一定是可能性最大的那个值
因为概率分布可能会很怪
因为概率分布可能会很怪
不过在二项分布中
期望值可以看成是最可能得到的那个结果
期望值可以看成是最可能得到的那个结果
40%命中率 投10次
最可能的结果是中4次
也可能进6次或3次 但4次的可能性最大
也可能进6次或3次 但4次的可能性最大
我一般是这样理解这个期望值的
即每一次投篮有40%的几率命中
可以理解为投篮总是中40%
那么投10次 自然是4次投中
可以这样来理解这个期望值
可以这样来理解这个期望值
下面来证明一下这就是二项分布的期望值
下面来证明一下这就是二项分布的期望值
想想 二项分布中 X=k的概率是多少
想想 二项分布中 X=k的概率是多少
我还是用这个篮球的例子来讲解
我还是用这个篮球的例子来讲解
k可以是投中3次或者多少次
k可以是投中3次或者多少次
k可以是投中3次或者多少次
n次投篮 从中选k
n次投篮 从中选k
之前我们做过很多了
后面还要乘以每一种基本情况的概率
后面还要乘以每一种基本情况的概率
基本情况也就是中k次 不中n-k次
于是需要乘以命中率p的k次方 p自乘k次
这是命中k次
还需要射失剩下的n-k次 射失的概率是1-p
还需要射失剩下的n-k次 射失的概率是1-p
命中k次 射失次数就必然是n-k次
命中k次 射失次数就必然是n-k次
命中k次 射失次数就必然是n-k次
总的来说 这就是二项分布中成功k次的概率
总的来说 这就是二项分布中成功k次的概率
我们知道 随机变量的期望值是概率加权平均值
我们知道 随机变量的期望值是概率加权平均值
我们知道 随机变量的期望值是概率加权平均值
我可不希望这一节让你们感到迷惑
这一节至少需要记住这个 就够了
这一节至少需要记住这个 就够了
后面的技术性比较强
不过能够帮助熟悉Σ等符号
同时也是对二项式系数的复习
同时也是对二项式系数的复习
总之 期望值就是这些经过概率加权之后的和
总之 期望值就是这些经过概率加权之后的和
也就是将X=k的概率乘以k 然后全部加起来
也就是将X=k的概率乘以k 然后全部加起来
对每一个k
所以二项分布的随机变量X 其期望值是
所以二项分布的随机变量X 其期望值是
求和
k从0一直到n 投篮中表示不中到全中
k从0一直到n 投篮中表示不中到全中
k从0一直到n 投篮中表示不中到全中
每一个求和项是结果k乘以k次投中的概率
每一个求和项是结果k乘以k次投中的概率
k次投中的概率也就是这个
k次投中的概率也就是这个
即k乘以n选k乘以p的k次方乘以1-p的n-k次方
即k乘以n选k乘以p的k次方乘以1-p的n-k次方
然后进行一些代数求和运算
然后进行一些代数求和运算
首先我们可以这样处理一下这个求和式
首先我们可以这样处理一下这个求和式
第一项的k=0
第一项的k=0
所以第一项整个为0
这一项对求和没有贡献
这一项对求和没有贡献
整个求和式可以写成
0乘以n选0乘以p的0次方乘以1-p的n-0次方
0乘以n选0乘以p的0次方乘以1-p的n-0次方
加0乘以n选1乘以p的1次方乘以1-p的n-1次方
加0乘以n选1乘以p的1次方乘以1-p的n-1次方
一直加下去 直到k=n为止
也就是n乘以n选n乘以p的n次方乘以1-p的n-n次方
也就是n乘以n选n乘以p的n次方乘以1-p的n-n次方
这是求和的展开式
这第一项为0 因为k=0 0乘以任何数为0
这第一项为0 因为k=0 0乘以任何数为0
这第一项为0 因为k=0 0乘以任何数为0
因此这一项可以在求和过程中忽略
求和可以写成这个形式
这和上面的求和是一样的
这和上面的求和是一样的
随机变量的期望值就是这个和
k不需要从0开始 从1开始即可
k=1一直到n k乘以n选k
乘以p的k次方 乘以1-p的n-k次方
以上只是将第一项去掉了
以上只是将第一项去掉了
这对后面的化简很有用处
这对后面的化简很有用处
下面把二项式系数写出来
下面把二项式系数写出来
哦 我的iPod同步弹出来了
关掉它 然后回来
下面把二项式系数写出来
下面把二项式系数写出来
k从1到n
k乘以n!/[k!(n-k)!]
k乘以n!/[k!(n-k)!]
乘以p的k次方乘以1-p的n-k次方
这里k/k!还可以进行一些化简
这里k/k!还可以进行一些化简
我可以重写一下k!
k!也就是k?(k-1)?(k-2)…一直乘到1
k!也就是k?(k-1)?(k-2)…一直乘到1
k!也就是k?(k-1)!
因为这是k乘以k-1一直到1
因为这是k乘以k-1一直到1
这个可以重写为k?(k-1)!
这样k和k就可以消掉
这样k和k就可以消掉
于是整个式子又可以重写
于是整个式子又可以重写
这样就得到
求和 k从1到n n!/[(k-1)!(n-k)!]
求和 k从1到n n!/[(k-1)!(n-k)!]
乘以p的k次方 乘以1-p的n-k次方
继续进行化简 最后我们要化简成np
继续进行化简 最后我们要化简成np
继续进行化简 最后我们要化简成np
我们可以提出一个np来
然后看其它东西能否得到1
n!可以用上面的技巧
n!可以写成n?(n-1)!
而p的k次方可以写成p乘p的k-1次方
然后可以提出n和p
有np乘以求和 k从1到n
后面是(n-1)!/[(k-1)!(n-k)!]
后面是(n-1)!/[(k-1)!(n-k)!]
乘以p的k-1次方 乘以1-p的n-k次方
乘以p的k-1次方 乘以1-p的n-k次方
我们希望期望值是np
也就是说 上面这个式子
应该等于这个
所以最终目的是让这个求和式等于1
为了实现这个目的 我将进行换元
令a=k-1
令a=k-1
b=n-1
那么n-k等于多少
a=k-1 则a+1=k
然后b+1=n 那么n-k=a+1-(b+1)=a-b
然后b+1=n 那么n-k=a+1-(b+1)=a-b
然后b+1=n 那么n-k=a+1-(b+1)=a-b
继续化简 有np乘以整个和
继续化简 有np乘以整个和
k从1到n
k=1时 a等于0
k=n时 a=n-1 所以a是从0到n-1
k=n时 a=n-1 所以a是从0到n-1
k=n时 a=n-1 所以a是从0到n-1
k=n时 a=n-1 所以a是从0到n-1
而n-1又等于b
所以a是从0到b 有点绕
你可以停下来琢磨琢磨
我已经超时了 必须得加快
b=n-1
所以有b! 除以k-1的阶乘
这也就是a!
然后n-k=… 我写反了 应该是b-a
然后n-k=… 我写反了 应该是b-a
n-k=b+1-(a+1)=b-a
n-k=b+1-(a+1)=b-a
所以这里是(b-a)!
后面是p的k-1次方 也就是p的a次方
乘以1-p的n-k次方
仍然有n-k=b-a
基本完成 这个是什么
基本完成 这个是什么
我以一种更简单的方式重写一下
这等于npΣ… a从0到b
其中这是b选a 从b中选a的不同选法种数
其中这是b选a 从b中选a的不同选法种数
乘以p的a次方 乘以1-p的b-a次方
这是什么
这里是对二项分布的每一项求和
比如a=0的概率是多少
这是每一种a值的概率
然后把所有放到一起求和
我简单画个图
a=0的概率是这么多
a=1时是另外一个概率 一直下去 越来越高
a=1时是另外一个概率 一直下去 越来越高
最后得到一个接近钟形曲线的形状
这一项对应于每一个概率
每个长方形代表这其中一项
a=0对应第一项 a=1对应第二项
a=2对应第三项 一直到a=b
所有这些相加 这些都是概率值
这相当于随机变量取到任意一个值的概率
随机变量取到任意某个值的概率
也就是所有可能的概率加起来
结果肯定等于1
以投硬币为例
以投硬币为例
这等于0次正面的概率+1次正面概率
这等于0次正面的概率+1次正面概率
加2次正面的概率+3次正面的概率
一直加到b次正面的概率
所有情况中任意一种发生的概率
也就是整个概率分布上的和 也就是1
也就是整个概率分布上的和 也就是1
这样随机变量X的期望值就是np了
这样随机变量X的期望值就是np了
其中n是试验次数 p是每次成功的概率
其中n是试验次数 p是每次成功的概率
该公式只针对二项分布 不针对其它分布的随机变量
该公式只针对二项分布 不针对其它分布的随机变量
只对二项分布的随机变量X成立
只对二项分布的随机变量X成立
这次超时太多了 下次见