• Tutorials >
  • (beta) 针对计算机视觉的量化迁移学习教程
Shortcuts

(beta) 针对计算机视觉的量化迁移学习教程

Created On: Dec 06, 2019 | Last Updated: Jul 27, 2021 | Last Verified: Nov 05, 2024

小技巧

为了充分利用本教程,我们建议使用此`Colab版本 <https://colab.research.google.com/github/pytorch/tutorials/blob/gh-pages/_downloads/quantized_transfer_learning_tutorial.ipynb>`_。这样您可以体验以下呈现的信息。

作者: Zafar Takhirov

审阅: Raghuraman Krishnamoorthi

编辑: Jessica Lin

本教程基于`PyTorch迁移学习 <https://pytorch.org/tutorials/beginner/transfer_learning_tutorial.html>`_教程,由`Sasank Chilamkurthy <https://chsasank.github.io/>`_编写。

迁移学习是指利用预训练模型在不同数据集上的应用技术。迁移学习有两种主要使用方式:

  1. ConvNet作为固定特征提取器: 在这里,您`“冻结” <https://arxiv.org/abs/1706.04983>`_网络中所有参数的权重,除了最后几层(称为“头部”,通常是全连接层)。这些最后的层被替换为新的层,初始化为随机权重,并仅训练这些层。

  2. 微调ConvNet: 与随机初始化不同,此方法使用预训练网络进行初始化,然后像平常一样进行不同数据集的训练。然而通常网络的头部(或部分头部)也会在输出数不同的情况下被替换。在此方法中,通常会设置较小的学习率,这是因为网络已经被训练过,只需要对其进行“小幅微调”以适应新数据集。

您也可以结合上述两个方法:首先冻结特征提取器,训练头部。之后可以解冻特征提取器(或部分特征提取器),设置一个较小的学习率,继续训练。

在这一部分,您将使用第一种方法——通过量化模型提取特征。

第0部分. 前置条件

在深入了解迁移学习之前,让我们回顾一下“先决条件”,例如安装和数据加载/可视化。

# Imports
import copy
import matplotlib.pyplot as plt
import numpy as np
import os
import time

plt.ion()

安装测试版

因为您将使用 PyTorch 的测试版部分,建议安装最新版本的 torchtorchvision。您可以在 这里 找到最新的本地安装说明。例如,若不需要 GPU 支持,可以安装:

pip install numpy
pip install --pre torch torchvision -f https://download.pytorch.org/whl/nightly/cpu/torch_nightly.html
# For CUDA support use https://download.pytorch.org/whl/nightly/cu101/torch_nightly.html

加载数据

备注

本部分与原始迁移学习教程相同。

我们将使用 torchvisiontorch.utils.data 包来加载数据。

您今天将解决的问题是从图像中分类 蚂蚁蜜蜂。数据集包含每类约 120 张训练图像,每类 75 张验证图像。这被认为是一个用于泛化的非常小的数据集。然而,由于我们使用迁移学习,应该能够合理地泛化。

此数据集是 imagenet 的非常小的子集。

备注

这里 下载数据并将其解压到 data 目录。

import torch
from torchvision import transforms, datasets

# Data augmentation and normalization for training
# Just normalization for validation
data_transforms = {
    'train': transforms.Compose([
        transforms.Resize(224),
        transforms.RandomCrop(224),
        transforms.RandomHorizontalFlip(),
        transforms.ToTensor(),
        transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
    ]),
    'val': transforms.Compose([
        transforms.Resize(224),
        transforms.CenterCrop(224),
        transforms.ToTensor(),
        transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
    ]),
}

data_dir = 'data/hymenoptera_data'
image_datasets = {x: datasets.ImageFolder(os.path.join(data_dir, x),
                                          data_transforms[x])
                  for x in ['train', 'val']}
dataloaders = {x: torch.utils.data.DataLoader(image_datasets[x], batch_size=16,
                                              shuffle=True, num_workers=8)
              for x in ['train', 'val']}
dataset_sizes = {x: len(image_datasets[x]) for x in ['train', 'val']}
class_names = image_datasets['train'].classes

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

可视化几张图像

让我们可视化几张训练图像,以便了解数据增强。

import torchvision

def imshow(inp, title=None, ax=None, figsize=(5, 5)):
  """Imshow for Tensor."""
  inp = inp.numpy().transpose((1, 2, 0))
  mean = np.array([0.485, 0.456, 0.406])
  std = np.array([0.229, 0.224, 0.225])
  inp = std * inp + mean
  inp = np.clip(inp, 0, 1)
  if ax is None:
    fig, ax = plt.subplots(1, figsize=figsize)
  ax.imshow(inp)
  ax.set_xticks([])
  ax.set_yticks([])
  if title is not None:
    ax.set_title(title)

# Get a batch of training data
inputs, classes = next(iter(dataloaders['train']))

# Make a grid from batch
out = torchvision.utils.make_grid(inputs, nrow=4)

fig, ax = plt.subplots(1, figsize=(10, 10))
imshow(out, title=[class_names[x] for x in classes], ax=ax)

模型训练的支持函数

下面是一个用于模型训练的通用函数。该函数还

  • 调度学习率

  • 保存最佳模型

def train_model(model, criterion, optimizer, scheduler, num_epochs=25, device='cpu'):
  """
  Support function for model training.

  Args:
    model: Model to be trained
    criterion: Optimization criterion (loss)
    optimizer: Optimizer to use for training
    scheduler: Instance of ``torch.optim.lr_scheduler``
    num_epochs: Number of epochs
    device: Device to run the training on. Must be 'cpu' or 'cuda'
  """
  since = time.time()

  best_model_wts = copy.deepcopy(model.state_dict())
  best_acc = 0.0

  for epoch in range(num_epochs):
    print('Epoch {}/{}'.format(epoch, num_epochs - 1))
    print('-' * 10)

    # Each epoch has a training and validation phase
    for phase in ['train', 'val']:
      if phase == 'train':
        model.train()  # Set model to training mode
      else:
        model.eval()   # Set model to evaluate mode

      running_loss = 0.0
      running_corrects = 0

      # Iterate over data.
      for inputs, labels in dataloaders[phase]:
        inputs = inputs.to(device)
        labels = labels.to(device)

        # zero the parameter gradients
        optimizer.zero_grad()

        # forward
        # track history if only in train
        with torch.set_grad_enabled(phase == 'train'):
          outputs = model(inputs)
          _, preds = torch.max(outputs, 1)
          loss = criterion(outputs, labels)

          # backward + optimize only if in training phase
          if phase == 'train':
            loss.backward()
            optimizer.step()

        # statistics
        running_loss += loss.item() * inputs.size(0)
        running_corrects += torch.sum(preds == labels.data)
      if phase == 'train':
        scheduler.step()

      epoch_loss = running_loss / dataset_sizes[phase]
      epoch_acc = running_corrects.double() / dataset_sizes[phase]

      print('{} Loss: {:.4f} Acc: {:.4f}'.format(
        phase, epoch_loss, epoch_acc))

      # deep copy the model
      if phase == 'val' and epoch_acc > best_acc:
        best_acc = epoch_acc
        best_model_wts = copy.deepcopy(model.state_dict())

    print()

  time_elapsed = time.time() - since
  print('Training complete in {:.0f}m {:.0f}s'.format(
    time_elapsed // 60, time_elapsed % 60))
  print('Best val Acc: {:4f}'.format(best_acc))

  # load best model weights
  model.load_state_dict(best_model_wts)
  return model

可视化模型预测的支持函数

通用函数,用于显示几个图像的预测结果

def visualize_model(model, rows=3, cols=3):
  was_training = model.training
  model.eval()
  current_row = current_col = 0
  fig, ax = plt.subplots(rows, cols, figsize=(cols*2, rows*2))

  with torch.no_grad():
    for idx, (imgs, lbls) in enumerate(dataloaders['val']):
      imgs = imgs.cpu()
      lbls = lbls.cpu()

      outputs = model(imgs)
      _, preds = torch.max(outputs, 1)

      for jdx in range(imgs.size()[0]):
        imshow(imgs.data[jdx], ax=ax[current_row, current_col])
        ax[current_row, current_col].axis('off')
        ax[current_row, current_col].set_title('predicted: {}'.format(class_names[preds[jdx]]))

        current_col += 1
        if current_col >= cols:
          current_row += 1
          current_col = 0
        if current_row >= rows:
          model.train(mode=was_training)
          return
    model.train(mode=was_training)

第一部分: 基于量化特征提取器的自定义分类器训练

在此部分中,您将使用一个“冻结”的量化特征提取器,并在其之上训练一个自定义分类器头。与浮点模型不同,您不需要为量化模型设置 requires_grad=False,因为它没有可训练的参数。请参考 文档 了解更多详情。

加载预训练模型:在本练习中您将使用 ResNet-18

import torchvision.models.quantization as models

# You will need the number of filters in the `fc` for future use.
# Here the size of each output sample is set to 2.
# Alternatively, it can be generalized to nn.Linear(num_ftrs, len(class_names)).
model_fe = models.resnet18(pretrained=True, progress=True, quantize=True)
num_ftrs = model_fe.fc.in_features

此时您需要修改预训练模型。模型在开头和结尾具有量化/反量化模块。然而,因为您只使用特征提取器,反量化层需要移到线性层(头部)之前。最简单的方法是将模型包装在 nn.Sequential 模块中。

第一步是将 ResNet 模型中的特征提取器隔离出来。尽管在本例中您需要使用所有层(除了 fc),实际上,您可以根据需要提取任意部分。如果您希望替换一些卷积层,这将非常有用。

备注

在将特征提取器从量化模型的其余部分分离时,您必须手动在希望保持量化的部分开始和结束处放置量化/反量化器。

以下函数创建一个具有自定义头的模型。

from torch import nn

def create_combined_model(model_fe):
  # Step 1. Isolate the feature extractor.
  model_fe_features = nn.Sequential(
    model_fe.quant,  # Quantize the input
    model_fe.conv1,
    model_fe.bn1,
    model_fe.relu,
    model_fe.maxpool,
    model_fe.layer1,
    model_fe.layer2,
    model_fe.layer3,
    model_fe.layer4,
    model_fe.avgpool,
    model_fe.dequant,  # Dequantize the output
  )

  # Step 2. Create a new "head"
  new_head = nn.Sequential(
    nn.Dropout(p=0.5),
    nn.Linear(num_ftrs, 2),
  )

  # Step 3. Combine, and don't forget the quant stubs.
  new_model = nn.Sequential(
    model_fe_features,
    nn.Flatten(1),
    new_head,
  )
  return new_model

警告

目前量化模型只能在 CPU 上运行。然而,可以将模型中非量化的部分发送到 GPU。

import torch.optim as optim
new_model = create_combined_model(model_fe)
new_model = new_model.to('cpu')

criterion = nn.CrossEntropyLoss()

# Note that we are only training the head.
optimizer_ft = optim.SGD(new_model.parameters(), lr=0.01, momentum=0.9)

# Decay LR by a factor of 0.1 every 7 epochs
exp_lr_scheduler = optim.lr_scheduler.StepLR(optimizer_ft, step_size=7, gamma=0.1)

训练和评估

此步骤在 CPU 上约需 15-25 分钟。因为量化模型只能在 CPU 上运行,您无法在 GPU 上进行训练。

new_model = train_model(new_model, criterion, optimizer_ft, exp_lr_scheduler,
                        num_epochs=25, device='cpu')

visualize_model(new_model)
plt.tight_layout()

第二部分:微调可量化模型

在此部分,我们微调用于迁移学习的特征提取器,并量化特征提取器。请注意,在第一部分和第二部分中,特征提取器都是量化的。不同之处在于第一部分使用预训练的量化模型。在本部分中,我们在感兴趣的数据集上微调后创建一个量化特征提取器,因此这是在享受量化优势的同时利用迁移学习提高精度的方法。请注意,在我们的具体示例中,训练集非常小(120 张图像),因此微调整个模型的好处并不明显。但此处展示的流程将改进使用更大数据集的迁移学习的准确性。

预训练的特征提取器必须是可量化的。为确保它是可量化的,请执行以下步骤:

  1. 使用 torch.quantization.fuse_modules 融合 (Conv, BN, ReLU), (Conv, BN), 和 (Conv, ReLU)

  2. 将特征提取器与一个自定义头部连接。这需要对特征提取器的输出进行反量化。

  3. 在特征提取器中适当位置插入伪量化模块,以在训练期间模拟量化。

对于步骤 (1),我们使用 torchvision/models/quantization 中的模型,这些模型有一个成员方法 fuse_model。此函数会融合所有的 convbnrelu 模块。对于自定义模型,这需要使用模块列表手动调用 torch.quantization.fuse_modules API。

步骤 (2) 由上一节中使用的 create_combined_model 函数执行。

使用 torch.quantization.prepare_qat 实现步骤 (3),它会插入伪量化模块。

作为步骤 (4),您可以开始“微调”模型,之后将其转换为完全量化版本(步骤 5)。

要将微调后的模型转换为量化模型,可以调用 torch.quantization.convert 函数(在我们的例子中,仅特征提取器被量化)。

备注

由于随机初始化,您的结果可能与本教程中显示的结果有所不同。

# notice `quantize=False`
model = models.resnet18(pretrained=True, progress=True, quantize=False)
num_ftrs = model.fc.in_features

# Step 1
model.train()
model.fuse_model()
# Step 2
model_ft = create_combined_model(model)
model_ft[0].qconfig = torch.quantization.default_qat_qconfig  # Use default QAT configuration
# Step 3
model_ft = torch.quantization.prepare_qat(model_ft, inplace=True)

微调模型

在当前教程中,整个模型都被微调。一般来说,这会导致更高的准确性。然而,由于这里使用的小训练集,我们最终会过拟合到训练集。

步骤 4:微调模型

for param in model_ft.parameters():
  param.requires_grad = True

model_ft.to(device)  # We can fine-tune on GPU if available

criterion = nn.CrossEntropyLoss()

# Note that we are training everything, so the learning rate is lower
# Notice the smaller learning rate
optimizer_ft = optim.SGD(model_ft.parameters(), lr=1e-3, momentum=0.9, weight_decay=0.1)

# Decay LR by a factor of 0.3 every several epochs
exp_lr_scheduler = optim.lr_scheduler.StepLR(optimizer_ft, step_size=5, gamma=0.3)

model_ft_tuned = train_model(model_ft, criterion, optimizer_ft, exp_lr_scheduler,
                             num_epochs=25, device=device)

步骤 5:转换为量化模型

from torch.quantization import convert
model_ft_tuned.cpu()

model_quantized_and_trained = convert(model_ft_tuned, inplace=False)

让我们看看量化模型在几张图像上的表现

visualize_model(model_quantized_and_trained)

plt.ioff()
plt.tight_layout()
plt.show()

文档

访问 PyTorch 的详细开发者文档

查看文档

教程

获取针对初学者和高级开发人员的深入教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源