文章目录(Table of Contents)
简介
这一篇介绍一下关于Anime的相关数据集, 之后会使用这个数据集来做GAN的实验. 这个数据集是一个"A collection of high-quality anime faces.", 里面包含高质量的高清的动漫人物的头像.
数据集作者: Mckinsey666
数据集介绍: Anime-Face-Dataset
数据集下载: Google Drive
Anime相关介绍
这个数据集收集了63632张高质量的动漫头像, 同时每一张图像的大小在90 × 90-120 × 120之间. 下面是完整的介绍, 包括原始图片的下载和图片的处理.
This is an dataset consisting of 63632 high-quality anime faces scraped from www.getchu.com, which are then cropped using the anime face detection algorithm in https://github.com/nagadomi/lbpcascade_animeface. Images sizes vary from 90 90 ~ 120 120 (you can simply rescale them before using them).
与其他的数据集相比, 这个数据集拥有更加清晰的背景和更加丰富的色彩.
但是这个数据集仍会有一些问题, 一些不是人脸的图片和一些不好的剪辑结果.
下面是数据集的部分的展示.
数据集的进一步处理
在我使用的时候, 我还做了进一步的处理, 我将数据集中所有小于64 × 64的图片都进了了删除, 只保留了大于64 × 64的图片.
- # 对路径内所有图片遍历, 删除不符合大小的图片
- def Preprocess(path):
- imagePaths = get_img_path(path) # 获取图片路径
- for imagePath in tqdm(imagePaths):
- imageTest = cv2.imread(imagePath, cv2.IMREAD_COLOR) # 读取图片
- try:
- if imageTest==None:
- os.remove(imagePath)
- except:
- if imageTest.shape[0]<64: # 查看图片大小
- os.remove(imagePath)
- 微信公众号
- 关注微信公众号
- QQ群
- 我们的QQ群号
评论