当前位置: 代码迷 >> python >> 包含矩阵N x M作为用于keras机器学习的输入的hdf5文件
  详细解决方案

包含矩阵N x M作为用于keras机器学习的输入的hdf5文件

热度:78   发布时间:2023-06-16 14:13:42.0

我需要有关机器学习输入的帮助/意见。

我有一个hdf5文件

combined.h5

包含几个数据集,每个数据集包含4 X 125的矩阵(4行和125列)

我一直在寻找如何输入包含矩阵的hdf5文件作为机器学习的输入,但是没有找到足够适合我的答案/示例作为参考。 下面是我修改后的脚本

import numpy as np
import h5py
from keras.models import Sequential
from keras.layers import Dense

seed = 7
np.random.seed(seed)

dataset = h5py.File('combined.h5', 'r') #has 5 dataset

X = dataset #input
Y = ["A","CFL","SS","G","FF"] #output

model = Sequential()
model.add(Dense(125, input_dim=125, init='normal', activation='relu'))
model.add(Dense(5, init='uniform', activation='sigmoid'))

model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

model.fit(X, Y, nb_epoch=150, batch_size=10)

scores = model.evaluate(X, Y)

print("%s: %.2f%%" % (model.metrics_names[1], scores[1]*100))

我运行了此脚本,并收到如下错误

TypeError: Error when checking model input: data should be a Numpy array, or list/dict of Numpy arrays. Found: <HDF5 file "combined.h5" (mode r)>...

我的问题是如何加载包含矩阵形式的数据集的hdf5文件作为机器学习的输入数据?

*其他问题,我想链接每个数据集的输出。 例如,数据集1的输出数据为“ A”,数据集2的输出数据为“ CFL”,依此类推...是否有适当的方法来完成此操作,或者用我在脚本中编写的内容是否足够?

谢谢您的帮助。

这应该用于每个命名的数据集:

X = dataset['dataset_name'][:] #input

要查找数据集的名称,可以使用以下脚本:

for key in dataset.keys():
    print key

在这里,您可以从文件中取出完整的数据集。 如果不对数据集进行切片,则只会得到指向h5py数据集对象的指针。 使用slice运算符提取numpy数组。 ( )

您只需要想象hdf5文件就像一个文件夹结构,就必须遍历该文件夹结构才能获取数据。 然后,您可以使用切片来加载数据。

  相关解决方案