Tip:
Highlight text to annotate it
X
我們來學習一下大數定律
在數學和機率理論中
它在很多層面上是最直觀的定律之一
但是因爲它適用於很多情況
卻往往被誤用或誤解
讓我們用較爲正式的數學方法
先給出定義
然後直觀地講
比如說我有一個隨機變數 X
並且我們知道其預定值或其總體平均值
大數定律只是說
如果我們抽取隨機變數的n個觀測樣本
而且如果我們取它們的平均值
讓我定義另一個變量
讓我們叫它 X n 並在頂部加一橫
這就是隨機變數的
n 個觀測值的均值
它實際上是我第一次的觀測
所以你可以說我的一次試驗
我得到這一觀測值 再次運行它 我又得到另一個觀測值
我繼續運行它 n 次
然後除以我觀測的次數
這就是我的樣本平均值
這是我做過的所有觀測數據的平均值
大數定律只是告訴我們這個樣本平均值
將趨近隨機變數的預定值
我也可以寫成樣本平均值將接近總體平均值
當 n 接近無窮大時
我會用非正式的方法來解釋接近
或趨近是什麽意思?
但我認爲 你的直觀會告訴你
如果我有足夠多的樣本 最終
我將得到總體的預定值
對很多人來說 這很直觀
那如果我做足夠多的實驗 這些實驗
將給我所期望的數字
鑒於預定值和機率等等
但我認爲人們經常有點誤解
爲什麽這會發生
我繼續之前 讓我給你
一個具體的例子
大數定律將只是告訴我們— — 比如說
有一個隨機變數--X 等於正面的次數
等於扔一個正常的硬幣100 次後
得到正面的次數
首先 我們知道這個隨機變數的
預定值
它是抛擲的次數或者試驗的次數乘以
任何試驗的成功機率
這就是等於 50
所以大數定律只是說: 如果我取一個樣本
或者我取一些試驗獲得的樣本的平均值
所以你知道 我得到 — — 我第一次進行該試驗時
翻轉 100 枚硬幣或有100枚硬幣放在鞋盒裏
我搖一搖鞋盒 並數正面的硬幣 得到 55個
這將是 X1
然後我再次搖動鞋盒 得到 65
然後我再次搖動鞋盒 得到 45
我重覆 n 次 然後除以
我做的次數
大數定律只告訴我們 這個平均數
即我的所有觀察的平均數
當n趨近無窮大時 這個平均數將趨近50
或 n 趨近 50
抱歉 n趨近無窮大
我想講講爲什麽出現這種情況
或直覺爲什麽這樣
有很多人這樣覺得 哦 這意味著
如果100次試驗後 我高於平均水平
機率的規則要給我更多的正面
或更少的正面以彌補差異
事實上將不會這樣
那往往被稱爲一個賭徒的謬論
讓我區分開來
我將用這個例子
比如說 — — 讓我畫一個圖
我將換個顏色
這是 n 我 x 軸是 n
這是我試驗的次數
我的 y 軸 是我的樣本平均值
而我們知道預定值是什麽
我們知道此隨機變數的預定值爲 50
讓我在這裡畫一下
這是 50
看看我這個例子
所以當 n 等於 — — 讓我 [聽不清]
在這裡
第一次試驗我得到55這就是我的平均值
我只有一個數據點
兩項試驗後 我得到 65
所以我平均值將是 65 加 55 除以 2
等於 60
於是我平均值擧升了一點
第三次試驗我得到45 這將使我平均值
下降了一點
我不會在這裡繪制 45
現在我要得出所有這些數的平均值
45 加 65 是什麽?
讓我來把數字理順
以便你能夠理解
所以 55 加 65
等於120 然後加 45 等於 165
除以 3
3 除165 5乘3 爲 15
53
不 不 不
55
所以平均值降到 55
我們可以繼續做這些試驗
所以你可能會說 大數定律是這個意思
好吧 我們做了 3 次試驗和我們的平均值在那裏
所以很多人認爲機率的神
傾向於在未來使我們獲得較少
的正面
那就是接下來的幾項試驗將不得不
得到較低的數字 以便使我們的平均數下降
其實並不一定如此
往後的機率始終是相同的
機率始終是50%
去得到正面
不是說如果我開頭有一些正面
或者開頭正面多一些
突然 情況得到補償:我會得到較多的反面
這是賭徒的謬論
如果你有一長串正面或你有
特別多的正面 在某個時刻
你要有--你有更高的可能性
得到特別多的反面
這並不完全正確
大數定律告訴我們的是它不管
在一些有限次數的試驗後
你的平均數實際上--這種情況發生的可能性很低
但比如說你的平均數在這裡
假設是 70
你會說: 哇 我們
偏離企望值好多
但大數定律說什麽 嗯
我不關心已有多少次試驗 因爲
我們還有無數次的試驗
這些無限次數試驗的預定值
尤其是在這種情況下將會這樣
所以 當你的有限次數的平均值
高一些 然後你的無限次數的平均值
將趨近於這個 隨著時間推移 趨近並回到
所期望的值
上面是較爲非正式的描述
這就是大數定律試圖告訴你的
它很重要
它並未告訴你 如果你已經得到了錢幣的一些正面
然後你得到反面的機率將會增加
以彌補前面得到的正面
它告訴你什麽是 不管前面發生了什麽
在有限數量的試驗下 無論怎樣 平均是
在有限數量的試驗之後
你還有無限次的試驗
如果你做了足夠多次 它將趨近並回到
它的預定值
而這是需要思考的重要的事
但這並不是每天在彩票和賭場中使用
因爲他們知道 如果你做足夠多的樣本
我們能夠計算出
如果你做足夠多的樣本
大大偏離的機率是什麽?
但賭場和彩票經營原理是這樣
如果你有足夠的人
短期內或通過幾個樣本
個別人可能打敗莊家
但長期下來莊家總是會贏
因爲他們制定了賭博的參數
然後讓你玩
不管怎麽說 這在機率論中很重要
我認爲這相當直觀
雖然有時當你看到它的正式解釋中
像這個隨機變數等等
有點令人困惑
所有這意思 當你采用越來越多的樣本
這些樣本的平均值將會
趨近真正的平均值
或者我應該說得更特殊一點
你的樣本平均數將要趨近於
真正的總煤樣本數的均值或
隨機變數的預定值
無論怎樣 下個影片再見