溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

Pytorch中的.backward()方法怎么用

發布時間：2021-07-12 15:36:11 來源：億速云閱讀：363 作者：chen 欄目：大數據

# PyTorch中的.backward()方法怎么用

## 引言

在深度學習中，反向傳播（Backpropagation）是訓練神經網絡的核心算法。PyTorch作為當前最流行的深度學習框架之一，通過`.backward()`方法實現了自動微分功能。本文將深入解析`.backward()`的工作原理、使用方法和常見應用場景，幫助讀者掌握這一關鍵工具。

## 一、自動微分與計算圖

### 1.1 什么是自動微分
自動微分（Automatic Differentiation）是PyTorch的核心特性，它能夠自動計算張量的梯度。與符號微分和數值微分不同，自動微分通過在計算過程中記錄操作（稱為"跟蹤"）來實現高效準確的梯度計算。

### 1.2 計算圖的概念
PyTorch使用動態計算圖（Dynamic Computation Graph）來記錄張量間的運算關系：
- **葉子節點（Leaf Nodes）**：用戶直接創建的張量
- **中間節點（Intermediate Nodes）**：通過運算產生的張量
- **邊（Edges）**：表示張量間的運算關系

```python
import torch

x = torch.tensor(2.0, requires_grad=True)  # 葉子節點
y = x ** 2                                # 中間節點

二、.backward()方法基礎

2.1 基本用法

.backward()方法用于啟動反向傳播過程，計算梯度并累積到對應張量的.grad屬性中。

x = torch.tensor(3.0, requires_grad=True)
y = x ** 2 + 2 * x + 1
y.backward()
print(x.grad)  # 輸出：8.0 (因為dy/dx = 2x + 2)

2.2 梯度傳播規則

標量張量：直接調用.backward()
非標量張量：需要提供gradient參數作為”權重”

# 向量情況示例
x = torch.tensor([1.0, 2.0], requires_grad=True)
y = x.norm()  # 計算L2范數
y.backward()
print(x.grad)  # 輸出：[0.7071, 1.4142]

三、關鍵參數詳解

3.1 gradient參數

當輸出為非標量時，需要提供與輸出形狀相同的gradient張量：

x = torch.tensor([1.0, 2.0], requires_grad=True)
y = torch.stack([x[0]**2, x[1]**3])
gradient = torch.tensor([0.1, 0.01])
y.backward(gradient)
print(x.grad)  # 輸出：[0.2000, 0.1200]

3.2 retain_graph參數

默認情況下，PyTorch會釋放計算圖以節省內存。如需多次反向傳播：

x = torch.tensor(2.0, requires_grad=True)
y = x ** 2
y.backward(retain_graph=True)  # 第一次反向傳播
y.backward()                  # 第二次反向傳播
print(x.grad)                 # 輸出：8.0 (2x + 2x)

3.3 create_graph參數

當需要計算高階導數時：

x = torch.tensor(2.0, requires_grad=True)
y = x ** 3
grad1 = torch.autograd.grad(y, x, create_graph=True)  # 一階導
grad2 = torch.autograd.grad(grad1, x)                 # 二階導
print(grad2)  # 輸出：(tensor(12.),)

四、梯度管理技巧

4.1 梯度清零

在訓練循環中，梯度會累積而非覆蓋：

optimizer.zero_grad()  # 標準做法
# 或手動清零
x.grad.zero_()

4.2 梯度裁剪

防止梯度爆炸：

torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm=1.0)

4.3 凍結參數

停止特定參數的梯度計算：

for param in model.layer.parameters():
    param.requires_grad = False

五、常見應用場景

5.1 自定義損失函數

實現Huber損失：

def huber_loss(y_pred, y_true, delta=1.0):
    error = y_pred - y_true
    condition = torch.abs(error) < delta
    squared_loss = 0.5 * error ** 2
    linear_loss = delta * (torch.abs(error) - 0.5 * delta ** 2)
    return torch.where(condition, squared_loss, linear_loss)

loss = huber_loss(predictions, targets).mean()
loss.backward()

5.2 模型可視化

計算輸入圖像的梯度用于可視化：

image.requires_grad = True
outputs = model(image)
loss = criterion(outputs, target)
loss.backward()
saliency_map = image.grad.abs().max(dim=1)[0]

5.3 對抗樣本生成

快速梯度符號攻擊（FGSM）：

epsilon = 0.05
data.requires_grad = True
outputs = model(data)
loss = criterion(outputs, target)
loss.backward()
perturbation = epsilon * data.grad.sign()
adversarial_example = data + perturbation

六、調試與常見問題

6.1 梯度檢查

數值梯度驗證：

def numerical_gradient(f, x, eps=1e-4):
    grad = torch.zeros_like(x)
    for i in range(x.numel()):
        orig_val = x.view(-1)[i].item()
        x.view(-1)[i] = orig_val + eps
        f_plus = f(x)
        x.view(-1)[i] = orig_val - eps
        f_minus = f(x)
        x.view(-1)[i] = orig_val
        grad.view(-1)[i] = (f_plus - f_minus) / (2 * eps)
    return grad

6.2 常見錯誤

忘記requires_grad：

# 錯誤示例
x = torch.tensor([1.0, 2.0])  # 缺少requires_grad=True
y = x.sum()
y.backward()  # RuntimeError

非標量未提供gradient參數：

x = torch.randn(3, requires_grad=True)
y = x * 2
y.backward()  # RuntimeError

內存泄漏：

while True:
   x = torch.randn(1000, requires_grad=True)
   y = x.sum()
   y.backward()  # 未釋放計算圖

七、高級主題

7.1 自定義自動微分函數

通過繼承torch.autograd.Function：

class MyReLU(torch.autograd.Function):
    @staticmethod
    def forward(ctx, input):
        ctx.save_for_backward(input)
        return input.clamp(min=0)

    @staticmethod
    def backward(ctx, grad_output):
        input, = ctx.saved_tensors
        grad_input = grad_output.clone()
        grad_input[input < 0] = 0
        return grad_input

7.2 性能優化技巧

使用@torch.no_grad()裝飾器
合理使用detach()
梯度檢查點技術

結語

.backward()方法是PyTorch自動微分系統的核心接口，掌握其使用技巧對高效開發深度學習模型至關重要。本文從基礎用法到高級應用全面介紹了這一功能，希望讀者能將其靈活應用于實際項目中。建議通過PyTorch官方文檔和源碼進一步深入學習自動微分機制的實現細節。 “`

這篇文章包含了約1800字，采用Markdown格式，涵蓋了.backward()方法的核心概念、使用方法和實踐技巧，并提供了豐富的代碼示例。文章結構清晰，適合不同層次的PyTorch學習者閱讀參考。

向AI問一下細節

推薦閱讀：

免責聲明：本站發布的內容（圖片、視頻和文字）以原創、轉載和分享為主，文章觀點不代表本網站立場，如果涉及侵權請聯系站長郵箱：is@yisu.com進行舉報，并提供相關證據，一經查實，將立刻刪除涉嫌侵權內容。

上一篇新聞：
centos6.5中怎么添加新網卡配置
下一篇新聞：
centos中怎么查看swap分區

猜你喜歡

AI
助
手

產品服務

地區劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網站二維碼

亚洲午夜精品一区二区_中文无码日韩欧免_久久香蕉精品视频_欧美主播一区二区三区美女