Skip to content

機率介紹(二)

重點1: 隨機變數 Random Variable

本質是是一個函數
以事件本身作為變數,將事件映射成實數數值,方便我們計算時使用

比如X=第一顆骰子擲出的點數 , Y=第二顆骰子擲出的點數
P(X+Y=6)就可以表達兩次骰子點數和為6的機率

Example 1

有兩個保險人,今天A出事的機率為0.05,B出事的機率為0.1,兩者出事為獨立事件 以 隨機變數X為A、B保險人出事人數 討論支付理賠金的機率分布

令X為支付保險人數
P(X=0) = P(A沒出事 $\cap$ B沒出事) = 0.95 * 0.9 = 0.855
P(X=1) = P(A沒出事 $\cap$ B出事) + P(A出事 $\cap$ B沒出事) = 0.95 * 0.1 + 0.05 * 0.9 = 0.14
P(X=2) = P(A出事 $\cap$ B出事) = 0.05 * 0.1 = 0.005

o.w (P(0>X),P(X>3)) = 0

隨機變數有分為 離散型連續型,依其可能值結果是否可數而定

重點2: 機率質量函數 (p.m.f) & 累積分布函數(c.d.f)

如果一個隨機變數發生的可能值皆為countable number,則該隨機變數稱為離散隨機變數

對於離散隨機變數,可以定義其probability mass function

Def: probability mass function (pmf)

機率密度函數在a的值 即為 隨機變數的值為a時的機率值 也就是 Pmf(a) = P{ X=a }
並且pmf有以下性質
(1) 隨機變數X的可能值,依順序編號為 $x_1 , x_2 … x_n $

$ P(X) > 0 \ , X \in [ x_1 , x_2 ... x_n ] $
$ P(X) = 0 \ , X \in R\setminus[ x_1 , x_2 ... x_n ] $

(2) pmf 總和為1 $$ \sum_{-\infty}^{\infty}P(X)=1 $$

以下是一個pmf的例子
投擲一顆公平的六面骰,令隨機變數X為骰子的出現點數
可知道X 將會是所有可能性中 {1,2,3,4,5,6} 的其中一種,並且所有可能性發生結果機率皆為1/6

也就是說,其pmf P(1)=1/6 , P(2)=1/6 … P(6)=1/6

  • 有趣的事,pmf、cdf、pdf這些函數都不符合機率公理對機率函數的定義(將事件 對應到 0至1之間) 但pmf其對應的值是隨機變數發生的機率

Def: Cumulative Distribution Function (cdf)

累積分布函數,通常以大寫$F_{x}(X)$表示,其意義為小於等於其參數的pmf值的和,也就是隨機變數發生小於等於這個值的機率
$$F(a) = P(X<=a) = \sum_{-\infty}^{a}P(X)$$ 以下再用公正六面骰為例

  • 若隨機變數是離散的,其cdf一定是不連續的,並且在可能發生值的地方發生跳點
  • 必定從0累積到1,這是因為pmf性質2的原因

Example 2

上圖是某個隨機變數的CDF,求其pmf (a). P(X=2) , (b). P(2 < X < 3 )

(a) P(X=2) = P(X>2) - P(X<=2) =F(2)的右極限 - F(2) = 11/12 - 2/3 = 0.25
(b) P(2 < X < 3 ) = P(X<=3) - P(X<=2) = F(3) - F(2) = 1/12

  • 從(a)題可以看出,在可能發生的單點機率值等於跳點相減 (若沒有跳點=>機率為0=>不是可能發生的點)
  • 從(b)題看出,發生的區間可以用CDF在上下界的差得到 (當然也可以用pmf去累加)

重點3: 期待值 與 變異數

針對隨機變數可以依其分布計算期待值(Expected Value)

期待值計算上為 隨機變數可能值依出現機率的加權平均

Def: Expected value

$$E[g(X)] = \sum_{i}g(x_i)p(x_i) ,\quad \forall P(x_i)>0 $$

其意義為 當發生無限次事件時,平均一次會出現的結果
可用於在發生次數夠大時做到比較精準的預測

比如,公正的兩面硬幣若出現正面為1分,反面為0分,則投擲100次後,結果會接近50分,也就是100*1/2 = 50

1/2 也就是公正硬幣分數的期待值

期待值有下列性質

  1. 期待值是線性函數,意即具有運算保留(operation preserve) E(aX+b) = aE(X) + b

  2. E($x^k$)為動差生成函數(moment generating function),期待值正是一階(k=1)動差

  3. 定義中的公式可以由 E(X)= \sum_{i}(x_i)p(x_i) 推導出來,大概推導想法是將被g(x)映射到相同值者蒐集起來,自然會將他們的機率合併增加(比如今天骰子的點數,大於2會得1分,其他0分,則3、4、5、6 (點)發生的機率會合併到 1(分) 中,剩下合併到0(分)中)

  4. 公式定義告訴我們不需要去討論映射後值出現的機率,一樣以上述骰子例子,已知各點機率分布、點數到分數的映射,就不需要討論各分數出現的機率分布也可以算出期待值

Def: Variance

$$Var(X) = E[{(X - E(X))}^2] = E[X^2] - {(E[X])}^2$$ 此式中間部分為定義,中間到右邊可用線性函數性質證明

變異數的意義為機率分布的離散程度,因為期待值是加權平均的概念,這裡以平均數舉例, 1,-1 與 100 , -100 的平均數皆為0,但後者變異較大,也就是每筆數字與平均值得差距較大(所以才這麼定義變異數)

變異數並不是線性函數,事實上 $$Var(aX+b) = a^2 Var(X) $$

也就是說,當所有可能性增加a倍,他們的變異程度會增加a的平方倍
而平移並不改變變異程度,這符合直覺

期待值與變異數是衡量一個分布的基本指標,能快速幫助我們了解分布

重點4: 常見離散機率分布

Bernoulli Distribution (白努力分布)

非常簡單、基礎的分布
可視為一次的是非題
比如公正兩面硬幣的正反面、某個字是否出現在句子中、檢查目標有沒有生病 …

其 pmf 定義如下:

$$ P(x) = p^x * (1-p)^{1-x} \quad x=1,0 $$

解釋:
p代表"成功"的機率,因為白努力試驗非成功即失敗,因此失敗機率為1-p
x=1 表示試驗成功,x=0 表示試驗失敗

我們以 $X \sim Bernoulli(p) $紀錄隨機變數X服從白努力分布
其中只需要p參數就可以唯一決定一個白努力分佈

期待值與變異數:
E(X) = p
Var(X) = p(1-p)

Binomial Distribution (二項式分布)

Reference

A First Course in Probability 9ed