【猫狗数据集】对一张张图像进行预测(而不是测试集)

时间:2022-07-23
本文章向大家介绍【猫狗数据集】对一张张图像进行预测(而不是测试集),主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

数据集下载地址:

链接:https://pan.baidu.com/s/1l1AnBgkAAEhh0vI5_loWKw 提取码:2xq4

创建数据集:https://www.cnblogs.com/xiximayou/p/12398285.html

读取数据集:https://www.cnblogs.com/xiximayou/p/12422827.html

进行训练:https://www.cnblogs.com/xiximayou/p/12448300.html

保存模型并继续进行训练:https://www.cnblogs.com/xiximayou/p/12452624.html

加载保存的模型并测试:https://www.cnblogs.com/xiximayou/p/12459499.html

划分验证集并边训练边验证:https://www.cnblogs.com/xiximayou/p/12464738.html

使用学习率衰减策略并边训练边测试:https://www.cnblogs.com/xiximayou/p/12468010.html

利用tensorboard可视化训练和测试过程:https://www.cnblogs.com/xiximayou/p/12482573.html

从命令行接收参数:https://www.cnblogs.com/xiximayou/p/12488662.html

使用top1和top5准确率来衡量模型:https://www.cnblogs.com/xiximayou/p/12489069.html

使用预训练的resnet18模型:https://www.cnblogs.com/xiximayou/p/12504579.html

计算数据集的平均值和方差:https://www.cnblogs.com/xiximayou/p/12507149.html

读取数据集的第二种方式:https://www.cnblogs.com/xiximayou/p/12516735.html

epoch、batchsize、step之间的关系:https://www.cnblogs.com/xiximayou/p/12405485.html

首先我们上传一些图片到image文件夹中:

然后我们画出这些图片看看是什么样子:

import cv2
import matplotlib.pyplot as plt
import glob

# 使用matplotlib展示多张图片
def matplotlib_multi_pic1():
  i=0
  for img in glob.glob('/content/drive/My Drive/colab notebooks/image/*.jpg'):
    img_name=img.split("/")[-1]
    img = cv2.imread(img)
    title=img_name
    #行,列,索引
    plt.subplot(3,3,i+1)
    plt.imshow(img)
    plt.title(title,fontsize=8)
    plt.xticks([])
    plt.yticks([])
    i+=1
  plt.show()
matplotlib_multi_pic1()

接着在test文件夹中新建一个test_from_image.py。

import torchvision
import sys
import torch
import torch.nn as nn
from PIL import Image
sys.path.append("/content/drive/My Drive/colab notebooks")
import glob
import numpy as np
import torchvision.transforms as transforms

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
model=torchvision.models.resnet18(pretrained=False)
model.fc = nn.Linear(model.fc.in_features,2,bias=False)
model.to(device)
model.eval()
save_path="/content/drive/My Drive/colab notebooks/output/resnet18_best.t7" 
checkpoint = torch.load(save_path)
model.load_state_dict(checkpoint['model'])
print("当前模型准确率为:",checkpoint["epoch_acc"])
images_path="/content/drive/My Drive/colab notebooks/image/"
transform = transforms.Compose([transforms.Resize((224,224))])
def predict():
  true_labels=[]
  output_labels=[]
  for image in glob.glob(images_path+"/*.jpg"):
    print(image)
    if "cat" in image.split("/")[-1]:
      tmp=0
    else:
      tmp=1
    true_labels.append(tmp)
    image=Image.open(image)
    image=image.resize((224,224))
    tensor=torch.from_numpy(np.asarray(image)).permute(2,0,1).float()/255.0
    print(tensor.shape)
    tensor=tensor.reshape((1,3,224,224))
    tensor=tensor.to(device)
    #print(tensor.shape)
    output=model(tensor)
    print(output)
    _, pred = torch.max(output.data,1)
    output_labels.append(pred.item())
  return true_labels,output_labels

true_labels,output_labels=predict()
print("正确的标签是:")
print(true_labels)
print("预测的标签是:")
print(output_labels)

说明:这里需要注意的地方有:

  • 图像要调整到网络输入一致的大小,即224×224
  • 将【高,宽,通道】要转换成【通道,高,宽】的格式
  • 输入的是【batchsize,C,H,W】,因此我们要增加一个batchsize维度
  • 之前训练好的模型是使用cuda(),因此要将模型和数据放在GPU中
  • 一定要转换状态,即model.eval()

结果:

下一节,可视化相应的特征图。