小編給大家分享一下怎么使用Python實現正態分布、正態分布采樣,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!
多元正態分布(多元高斯分布)
直接從多元正態分布講起。多元正態分布公式如下:
這就是多元正態分布的定義,均值好理解,就是高斯分布的概率分布值最大的位置,進行采樣時也就是采樣的中心點。而協方差矩陣在多維上形式較多。
協方差矩陣
一般來說,協方差矩陣有三種形式,分別稱為球形、對角和全協方差。以二元為例:
為了方便展示不同協方差矩陣的效果,我們以二維為例。(書上截的圖,湊活著看吧,是在不想畫圖了)
其實從這個圖上可以很好的看出,協方差矩陣對正態分布的影響,也就很好明白了這三個協方差矩陣是哪里來的名字了??梢钥闯?,球形協方差矩陣,會產生圓形(二維)或者球形(三維)的等高線,對角協方差矩陣和全協方差矩陣,會產生橢圓形的等高線。更一般地,在一個D維空間中,球形協方差矩陣,會產生一個D維球面等高線;對角協方差矩陣,會產生一個坐標軸對其的橢球型等高線;全協方差矩陣,會在任意位置產生一個坐標軸對其的橢球型等高線。
當協方差矩陣是球形的或者是對角的,單獨的變量之間是獨立的
協方差分解
時間不足,具體解釋以后再補
下面是協方差分解的原理圖
變量的線性變換(正態分布采樣原理)
python實現
多元正態分布在python的numpy庫中有很方便一個函數:
np.random.multivariate_normal(mean=mean, cov=conv, size=N)
這個函數中,mean代表均值,是在每個維度中的均值。cov代表協方差矩陣,就像上面講的那種形式,協方差矩陣值的大小將決定采樣范圍的大小。size代表需要采樣生成的點數,此時輸出大小為(N*D)的坐標矩陣。
另外,其他參數包括:check_valid,這個參數用于決定當cov即協方差矩陣不是半正定矩陣時程序的處理方式,它一共有三個值:warn,raise以及ignore。當使用warn作為傳入的參數時,如果cov不是半正定的程序會輸出警告但仍舊會得到結果;當使用raise作為傳入的參數時,如果cov不是半正定的程序會報錯且不會計算出結果;當使用ignore時忽略這個問題即無論cov是否為半正定的都會計算出結果
tol:檢查協方差矩陣奇異值時的公差,float類型。
下面是一個小demo
import numpy as np import matplotlib.pyplot as plt mean = np.array([2,1]) # 均值 conv = np.array([[0.5, 0.0], # 協方差矩陣 [0.0, 0.5]]) axis = np.random.multivariate_normal(mean=mean, cov=conv, size=200) x, y = np.random.multivariate_normal(mean=mean, cov=conv, size=1000).T # print(axis[:]) plt.plot(axis[:, 0], axis[:, 1], 'ro') plt.show() plt.plot(x, y, 'ro') plt.show()
注意,單獨取出每個坐標軸的坐標數組時,需要在最后加上.T,否則會報錯 效果展示:
協方差值的大小對采樣的影響:
mean = np.array([2,1]) # 均值 conv = np.array([[0.5, 0.0], # 協方差矩陣 [0.0, 0.5]]) conv2 = np.array([[10, 0.0], # 協方差矩陣 [0.0, 10]]) axis = np.random.multivariate_normal(mean=mean, cov=conv, size=200) x, y = np.random.multivariate_normal(mean=mean, cov=conv2, size=200).T # print(axis[:]) plt.plot(axis[:, 0], axis[:, 1], 'ro') plt.show() plt.plot(x, y, 'ro') plt.show()
效果如下:
這里沒有設定隨機種子店,每次隨機數會有所不同。
以上是“怎么使用Python實現正態分布、正態分布采樣”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。