PyTorch中的nn.ConvTranspose2d模塊詳解

更新時間：2024年09月09日 10:13:06 作者：Midsummer-逐夢

nn.ConvTranspose2d是PyTorch中用于實現(xiàn)二維轉置卷積的模塊，廣泛應用于生成對抗網絡（GANs）和卷積神經網絡（CNNs）的解碼器中。該模塊通過參數如輸入輸出通道數、卷積核大小、步長、填充等，能控制輸出尺寸和避免棋盤效應

一、簡介

nn.ConvTranspose2d 是 PyTorch 中的一個模塊，用于實現(xiàn)二維轉置卷積（也稱為反卷積或上采樣卷積）。

轉置卷積通常用于生成比輸入更大的輸出，例如在生成對抗網絡（GANs）和卷積神經網絡（CNNs）的解碼器部分。

二、語法和參數

語法

torch.nn.ConvTranspose2d(in_channels, out_channels, kernel_size, stride=1, padding=0, output_padding=0, groups=1, bias=True, dilation=1, padding_mode='zeros')

參數

in_channels: 輸入通道的數量。
out_channels: 輸出通道的數量。
kernel_size: 卷積核的大小，可以是單個整數或是一個包含兩個整數的元組。
stride: 卷積的步長，默認為1?？梢允菃蝹€整數或是一個包含兩個整數的元組。
padding: 輸入的每一邊補充0的數量，默認為0。
output_padding: 輸出的每一邊額外補充0的數量，默認為0。用于控制輸出的大小。
groups: 將輸入分成若干組，默認為1。
bias: 如果為True，則會添加偏置，默認為True。
dilation: 卷積核元素之間的間距，默認為1。
padding_mode: 可選的填充模式，包括 ‘zeros’, ‘reflect’, ‘replicate’ 或 ‘circular’。默認為 ‘zeros’。

三、實例

3.1 創(chuàng)建基本的ConvTranspose2d層

代碼

import torch
import torch.nn as nn

# 定義 ConvTranspose2d 模塊
conv_transpose = nn.ConvTranspose2d(in_channels=1, out_channels=1, kernel_size=3, stride=2, padding=1)

# 創(chuàng)建一個示例輸入張量
input_tensor = torch.randn(1, 1, 4, 4)

# 通過 ConvTranspose2d 模塊計算輸出
output_tensor = conv_transpose(input_tensor)

print("輸入張量的形狀:", input_tensor.shape)
print("輸出張量的形狀:", output_tensor.shape)

輸出

輸入張量的形狀: torch.Size([1, 1, 4, 4])
輸出張量的形狀: torch.Size([1, 1, 7, 7])

3.2 使用多個輸出通道的ConvTranspose2d

代碼

import torch
import torch.nn as nn

# 定義 ConvTranspose2d 模塊，具有多個輸出通道
conv_transpose = nn.ConvTranspose2d(in_channels=1, out_channels=3, kernel_size=3, stride=2, padding=1)

# 創(chuàng)建一個示例輸入張量
input_tensor = torch.randn(1, 1, 4, 4)

# 通過 ConvTranspose2d 模塊計算輸出
output_tensor = conv_transpose(input_tensor)

print("輸入張量的形狀:", input_tensor.shape)
print("輸出張量的形狀:", output_tensor.shape)