您的位置：首页 > 其它

深度学习数据集+模型说明

2016-06-08 19:20 176 查看

1、mnist

Google实验室的Corinna Cortes和纽约大学柯朗研究所的Yann LeCun建的一个手写数字数据库，训练库有60,000张手写数字图像，测试库有10,000张。对应的手写识别模型为LeNet。

数据地址：http://yann.lecun.com/exdb/mnist/

2、cifar10

由Hinton的两个大弟子Alex Krizhevsky、Ilya Sutskever收集的一个用于普适物体识别的数据集。Cifar是加拿大牵头投资的一个先进科学项目研究所。

CIFAR-10数据集包含60000个32*32的彩色图像，共有10类。有50000个训练图像和10000个测试图像。数据集分为5个训练块和1个测试块，每个块有10000个图像。测试块包含从每类随机选择的1000个图像。训练块以随机的顺序包含这些图像，但一些训练块可能比其它类包含更多的图像。训练块每类包含5000个图像。类间完全互斥。这个数据集最大的特点在于将识别迁移到了普适物体，而且应用于多分类（姊妹数据集Cifar-100达到100类，ILSVRC比赛则是1000类）。同已经成熟的人脸识别相比，普适物体识别挑战巨大，数据中含有大量特征、噪声，识别物体比例不一，而且分类庞大。

3、cifar100

数据集包含100小类，每小类包含600个图像，其中有500个训练图像和100个测试图像。100类被分组为20个大类。每个图像带有1个小类的“fine”标签和1个大类“coarse”标签。

4、ImageNet

ImageNet 是一个计算机视觉系统识别项目，是目前世界上图像识别最大的数据库。2010年，来自斯坦福大学、普林斯顿大学及哥伦比亚大学的科学家们启动ImageNet大规模视觉识别挑战赛（ImageNet Large Scale Visual Recognition Challenge，ILSVRC）。ILSVRC2012是2012年的比赛数据集，在此次比赛中，Alex提出的AlexNet网络结构模型赢得了冠军；ILSVRC2014是2014年的比赛数据集，在此次比赛中，GoogLeNet，VGGNet分获冠亚军。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航