博客專欄

EEPW首頁 > 博客 > 13 種必須掌握的概率分布 !干貨總結!

13 種必須掌握的概率分布 !干貨總結!

發(fā)布人:數(shù)據(jù)派THU 時間:2023-05-22 來源:工程師 發(fā)布文章
01 概率分布概述


圖片

  • 共軛意味著它有共軛分布的關系。


在貝葉斯概率論中,如果后驗分布 p(θx)與先驗概率分布 p(θ)在同一概率分布族中,則先驗和后驗稱為共軛分布,先驗稱為似然函數(shù)的共軛先驗。共軛先驗維基百科在這里(https://en.wikipedia.org/wiki/Conjugate_prior)。

  • 多分類表示隨機方差大于 2。
  • n 次意味著我們也考慮了先驗概率 p(x)。
  • 為了進一步了解概率,我建議閱讀 [pattern recognition and machine learning,Bishop 2006]。

02 分布概率與特征
1、均勻分布(連續(xù))

代碼:

https://github.com/graykode/distribution-is-all-you-need/blob/master/uniform.py


均勻分布在 [a,b] 上具有相同的概率值,是簡單概率分布。
圖片
2、伯努利分布(離散)

代碼:

https://github.com/graykode/distribution-is-all-you-need/blob/master/bernoulli.py


  • 先驗概率 p(x)不考慮伯努利分布。因此,如果我們對最大似然進行優(yōu)化,那么我們很容易被過度擬合。
  • 利用二元交叉熵對二項分類進行分類。它的形式與伯努利分布的負對數(shù)相同。

圖片
3、二項分布(離散)

代碼:

https://github.com/graykode/distribution-is-all-you-need/blob/master/binomial.py


  • 參數(shù)為 n 和 p 的二項分布是一系列 n 個獨立實驗中成功次數(shù)的離散概率分布。
  • 二項式分布是指通過指定要提前挑選的數(shù)量而考慮先驗概率的分布。

圖片
4、多伯努利分布,分類分布(離散)

代碼:

https://github.com/graykode/distribution-is-all-you-need/blob/master/categorical.py


  • 多伯努利稱為分類分布。
  • 交叉熵和采取負對數(shù)的多伯努利分布具有相同的形式。

圖片
5、多項式分布(離散)

代碼:

https://github.com/graykode/distribution-is-all-you-need/blob/master/multinomial.py


多項式分布與分類分布的關系與伯努爾分布與二項分布的關系相同。
圖片
6、β分布(連續(xù))

代碼:

https://github.com/graykode/distribution-is-all-you-need/blob/master/beta.py


  • β分布與二項分布和伯努利分布共軛。
  • 利用共軛,利用已知的先驗分布可以更容易地得到后驗分布。
  • 當β分布滿足特殊情況(α=1,β=1)時,均勻分布是相同的。

圖片
7、Dirichlet 分布(連續(xù))
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/dirichlet.py
  • dirichlet 分布與多項式分布是共軛的。
  • 如果 k=2,則為β分布。

圖片
8、伽馬分布(連續(xù))

代碼:

https://github.com/graykode/distribution-is-all-you-need/blob/master/gamma.py


  • 如果 gamma(a,1)/gamma(a,1)+gamma(b,1)與 beta(a,b)相同,則 gamma 分布為β分布。
  • 指數(shù)分布和卡方分布是伽馬分布的特例。

圖片
9、指數(shù)分布(連續(xù))
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/exponential.py
指數(shù)分布是 α 為 1 時 γ 分布的特例。
圖片
10、高斯分布(連續(xù))
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/gaussian.py
高斯分布是一種非常常見的連續(xù)概率分布。

圖片
11、正態(tài)分布(連續(xù))
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/normal.py
正態(tài)分布為標準高斯分布,平均值為 0,標準差為 1。

圖片
12、卡方分布(連續(xù))
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/chi-squared.py
  • k 自由度的卡方分布是 k 個獨立標準正態(tài)隨機變量的平方和的分布。
  • 卡方分布是 β 分布的特例

圖片
13、t 分布(連續(xù))
代碼:https://github.com/graykode/distribution-is-all-you-need/blob/master/student-t.py
t 分布是對稱的鐘形分布,與正態(tài)分布類似,但尾部較重,這意味著它更容易產(chǎn)生遠低于平均值的值。
圖片
via:https://github.com/graykode/distribution-is-all-you-need


*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯(lián)系工作人員刪除。



關鍵詞: AI

相關推薦

技術專區(qū)

關閉