本文小編為大家詳細介紹“Pytorch中的torch.distributions庫怎么使用”,內容詳細,步驟清晰,細節處理妥當,希望這篇“Pytorch中的torch.distributions庫怎么使用”文章能幫助大家解決疑惑,下面跟著小編的思路慢慢深入,一起來學習新知識吧。
torch.distributions包包含可參數化的概率分布和采樣函數。 這允許構建用于優化的隨機計算圖和隨機梯度估計器。
不可能通過隨機樣本直接反向傳播。 但是,有兩種主要方法可以創建可以反向傳播的代理函數。
這些是
評分函數估計量 score function estimato
似然比估計量 likelihood ratio estimator
REINFORCE
路徑導數估計量 pathwise derivative estimator
REINFORCE 通常被視為強化學習中策略梯度方法的基礎,
路徑導數估計器常見于變分自編碼器的重新參數化技巧中。
雖然評分函數只需要樣本 f(x)的值,但路徑導數需要導數 f'(x)。
本文重點講解Pytorch中的 torch.distributions庫。
pytorch 的 torch.distributions 中可以定義正態分布:
import torch from torch.distributions import Normal mean=torch.Tensor([0,2]) normal=Normal(mean,1)
sample()
就是直接在定義的正太分布(均值為mean,標準差std是1)上采樣:
result = normal.sample() print("sample():",result)
輸出:
sample(): tensor([-1.3362, 3.1730])
rsample()
不是在定義的正太分布上采樣,而是先對標準正太分布 N(0,1) 進行采樣,然后輸出: mean + std × 采樣值
result = normal.rsample() print("rsample():",result)
輸出:
rsample: tensor([ 0.0530, 2.8396])
log_prob(value)
是計算value在定義的正態分布(mean,1)中對應的概率的對數,正太分布概率密度函數是:
對其取對數可得:
這里我們通過對數概率還原其對應的真實概率:
print("result log_prob:",normal.log_prob(result).exp())
輸出:
result log_prob: tensor([ 0.1634, 0.2005])
讀到這里,這篇“Pytorch中的torch.distributions庫怎么使用”文章已經介紹完畢,想要掌握這篇文章的知識點還需要大家自己動手實踐使用過才能領會,如果想了解更多相關內容的文章,歡迎關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。