Anime-Face-Dataset数据集介绍

  • A+
所属分类:大数据分析
摘要这里会介绍一个GAN会使用到的数据集, Anime Dataset. 这个数据集包括各种动漫人物的高清头像.

简介

这一篇介绍一下关于Anime的相关数据集, 之后会使用这个数据集来做GAN的实验. 这个数据集是一个"A collection of high-quality anime faces.", 里面包含高质量的高清的动漫人物的头像.

数据集作者: Mckinsey666

数据集介绍Anime-Face-Dataset

数据集下载Google Drive

Anime相关介绍

这个数据集收集了63632张高质量的动漫头像, 同时每一张图像的大小在90 × 90-120 × 120之间. 下面是完整的介绍, 包括原始图片的下载和图片的处理.

This is an dataset consisting of 63632 high-quality anime faces scraped from www.getchu.com, which are then cropped using the anime face detection algorithm in https://github.com/nagadomi/lbpcascade_animeface. Images sizes vary from 90 90 ~ 120 120 (you can simply rescale them before using them).

与其他的数据集相比, 这个数据集拥有更加清晰的背景和更加丰富的色彩.

但是这个数据集仍会有一些问题, 一些不是人脸的图片和一些不好的剪辑结果.

下面是数据集的部分的展示.

Anime-Face-Dataset数据集介绍

数据集的进一步处理

在我使用的时候, 我还做了进一步的处理, 我将数据集中所有小于64 × 64的图片都进了了删除, 只保留了大于64 × 64的图片.

  1. # 对路径内所有图片遍历, 删除不符合大小的图片
  2. def Preprocess(path):
  3.     imagePaths = get_img_path(path) # 获取图片路径
  4.     for imagePath in tqdm(imagePaths):
  5.         imageTest = cv2.imread(imagePath, cv2.IMREAD_COLOR) # 读取图片
  6.         try:
  7.             if imageTest==None:
  8.                 os.remove(imagePath)
  9.         except:
  10.             if imageTest.shape[0]<64: # 查看图片大小
  11.                 os.remove(imagePath)

 

  • 微信公众号
  • 关注微信公众号
  • weinxin
  • QQ群
  • 我们的QQ群号
  • weinxin
王 茂南

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: