此文章为翻译文章(夹杂着我的个人使用看法),原址:https://keras.io/api/datasets/
Darasets
tensorflow.keras.datasets模型提供了一些已在numpy格式中向量化了的数据集,可以被用来调试模型或者创建一些简单的代码实例
Available datasets
mnist数字分类数据集
cifar10小图像分类数据集
cifar100小图像分类数据集
imdb电影评论情感分类数据集
Reuters newswire classification dataset(路透社新闻分类数据集)
Boston Housing price regression dataset(波士顿房屋价格回归数据集)
因为我目前只用到了mnist,所以我只着重讲一下mnist(其他的到时候我用到了再补充吧)
mnist是手写数字数据集,如果在开头引用 from tensorflow.keras.datasets import mnist 会出现随机的手写数字数据与你所规定的“正确答案”进行比对,从而实现识别手写数字的功能
(以下回归翻译内容)mnist里的load_data函数,格式:tensorflow.keras.datasets.mnist.load_data(path="xxxxx")
这是一个包含10位数的60,000张28x28灰度图像的数据集,以及10,000张图像的测试集
参数path:本地缓存数据集的路径
返回numpy数组的元组:(x_train,y_train),(x_test,y_test)
x_train , x_test : uint8具有形状的灰度图像数据数组
y_train,y_test:uint8形状为(num_samples)的数字标签数组(范围为0-9的整数)。