溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

Pytorch中怎么使用finetune

發布時間：2021-07-30 17:37:48 來源：億速云閱讀：262 作者：Leah 欄目：大數據

Pytorch中怎么使用finetune，很多新手對此不是很清楚，為了幫助大家解決這個難題，下面小編將為大家詳細講解，有這方面需求的人可以來學習下，希望你能有所收獲。

1.固定參數

for name, child in model.named_children():
  for param in child.parameters():
    param.requires_grad = False

后，只傳入需要反傳的參數，否則會報錯

filter(lambda param: param.requires_grad, model.parameters())

2.調低學習率，加快衰減

finetune是在預訓練模型上進行微調，學習速率不能太大。

目前不清楚：學習速率降低的幅度可以更快一些。這樣以來，在使用step的策略時，stepsize可以更小一些。

直接從原始數據訓練的base_lr一般為0.01，微調要比0.01小,置為0.001

要比直接訓練的小一些，直接訓練的stepsize為100000，finetune的stepsize: 50000

3. 固定bn或取消dropout：

batchnorm會影響訓練的效果，隨著每個batch，追蹤樣本的均值和方差。對于固定的網絡，bn應該使用全局的數值

def freeze_bn(self):
  for layer in self.modules():
    if isinstance(layer, nn.BatchNorm2d):
      layer.eval()

訓練時，model.train()會修改模式，freeze_zn()應該在這里后面

4.過濾參數

訓練時，對于優化器，應該只傳入需要改變的參數，否則會報錯

filter(lambda p: p.requires_grad, model.parameters())

看完上述內容是否對您有幫助呢？如果還想對相關知識有進一步的了解或閱讀更多相關文章，請關注億速云行業資訊頻道，感謝您對億速云的支持。

向AI問一下細節

推薦閱讀：

免責聲明：本站發布的內容（圖片、視頻和文字）以原創、轉載和分享為主，文章觀點不代表本網站立場，如果涉及侵權請聯系站長郵箱：is@yisu.com進行舉報，并提供相關證據，一經查實，將立刻刪除涉嫌侵權內容。

上一篇新聞：
Linux上怎么使用backup-manager進行系統備份
下一篇新聞：
Pytorch中Softmax和LogSoftmax如何使用

猜你喜歡

AI
助
手

產品服務

地區劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網站二維碼

亚洲午夜精品一区二区_中文无码日韩欧免_久久香蕉精品视频_欧美主播一区二区三区美女