Pytorch图像处理,显示与保存

王茂南

3454
文章

75
评论

2019年9月1日07:00:32

评论1 3538字阅读11分47秒

摘要这一篇主要介绍关于Pytorch中进行图像处理的一些操作, 包括图像的处理(大小裁剪, 归一化, 转换为tensor), 接着介绍pytorch中的make_grid和save_image的使用.

文章目录(Table of Contents)

简介

这一篇文章我们主要会介绍在使用Pytorch的时候, 我们的数据集是图像的时候的一些操作. 之前也是零散的写过一些pytorch中图像的处理, 如Pytorch中图片数据集处理方式，我们在这里集中的描述一下.

这里主要会介绍以下的内容:

图像的标准化, 为什么要使用0.5来作为标准化的值.
使用ImageFolder来完成图片数据集的导入.
使用make_grid来完成图像的显示.
使用save_image来完成图像的保存.

同时, 会增加一部分, 直接使用cv2来对整个文件夹内的图片进行处理, 并生成新的图片. 关于opencv的更多内容, 可以查看文章图像处理-matplotlib显示opencv图像

使用cv2处理图像

有的时候, 我们希望直接对原始的图像进行处理, 并将处理好的图像保存下来, 这个时候就可以直接使用cv2进行处理. 下面看一个例子, 实现关于:

调整原始图片的大小
将原始图片转换为灰度图

# 将图片重新存储
# - 调整大小
# - 调整为灰色
def image_preprocess(dir_path='./dogs_cats_gray/cat/'):
"""图片预处理
"""
i = 0
for img in tqdm(os.listdir(dir_path)): # 调用 tqdm 可视化循环处理过程
img_path = os.path.join(dir_path, img) # 图像的完整路径
img_data = cv2.imread(img_path, cv2.IMREAD_GRAYSCALE) # 使用 opencv读取图像
img_data = cv2.resize(img_data, (64, 64)) # 图片处理成统一大小
os.remove(img_path) # 删除原始图像
cv2.imwrite(img_path, img_data)# 保存新的图像
i = i + 1
if i%5000 == 0:
print('i:',i,'img_name:',img,image_label(img))

关于使用cv2来进行图像的显示, 可以使用imshow来进行显示.

import cv2
# 查看两张图片
img_path1 = "./dogs_cats/cat/cat.7.jpg"
img_check1 = cv2.imread(img_path1, cv2.IMREAD_GRAYSCALE)
img_path2 = "./dogs_cats/dog/dog.8.jpg"
img_check2 = cv2.imread(img_path2, cv2.IMREAD_GRAYSCALE)
# 显示图片
fig, axes = plt.subplots(nrows=1, ncols=2,figsize=(13,7))
axes[0].imshow(img_check1,'gray')
axes[1].imshow(img_check2,'gray')

Pytorch图像处理

图像的标准化

我们通常会使用如下的方式对图像进行处理, 我们会控制图像的大小, 转换为tensor, 同时进行标准化.

trans = transforms.Compose([
transforms.Resize(64),
transforms.ToTensor(),
transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))
])

下面简单说明以下为什么标准化里的参数都是0.5, 这可以保证标准化之后的图像的像素值在-1到1之间. 这是因为: For example, the minimum value 0 will be converted to (0-0.5)/0.5=-1, the maximum value of 1 will be converted to (1-0.5)/0.5=1.

我们可以使用下面的方式将像素值进行还原: image = ((image * std) + mean)

参考资料: Understanding transform.Normalize( )