目录

  1. 概述
  2. 数据文件名
  3. 附录

概述

CIFAR-10 是一个更接近普适物体的彩色图像数据集。CIFAR-10 是由 Hinton 的学生 Alex Krizhevsky 和 Ilya Sutskever 整理的一个用于识别普适物体的小型数据集。一共包含 10 个类别的 RGB 彩色图片:飞机( airplane )、汽车( automobile )、鸟类( bird )、猫( cat )、鹿( deer )、狗( dog )、蛙类( frog )、马( horse )、船( ship )和卡车( truck )

✨ 每个图片的尺寸为 32 × 32 ,每个类别有 6000 个图像,数据集中一共有 50000 张训练图片和 10000 张测试图片

📚官网链接:The CIFAR-10 dataset

🆚 与 MNIST 数据集中目比, CIFAR-10 具有以下不同点:

  • CIFAR-10 是 3 通道的彩色 RGB 图像,而 MNIST 是灰度图像
  • CIFAR-10 的图片尺寸为 32 × 32 , 而 MNIST 的图片尺寸为 28 × 28
  • 相比于手写字符, CIFAR-10 含有的是现实世界中真实的物体,不仅噪声很大,而且物体的比例、特征都不尽相同,这为识别带来很大困难。直接的线性模型如 Softmax 在 CIFAR-10 上表现得很差

数据文件名

下载并解压数据集后,是如下形式:

文件名文件用途
batches.meta文件存储了每个类别的英文名称。
databatch{1…5}这 5 个文件是 CIFAR- 10 数据集中的训练数据。每个文件以二进制格式存储了 10000 张 32 × 32 的彩色图像和这些图像对应的类别标签。一共 50000 张训练图像
test_batch这个文件存储的是测试图像和测试图像的标签。一共 10000 张

附录

数据集——CIFAR-10