微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python – Pandas无法读取用h5py创建的hdf5文件

当我尝试读取用h5py创建的HDF5格式文件时,我得到了pandas错误.我想知道我是不是做错了什么?

import h5py
import numpy as np
import pandas as pd
h5_file = h5py.File('test.h5', 'w')
h5_file.create_dataset('zeros', data=np.zeros(shape=(3, 5)), dtype='f')
h5_file.close()
pd_file = pd.read_hdf('test.h5', 'zeros')

给出错误
TypeError:如果对象不存在或传递值,则无法创建存储器

我尝试将密钥集指定为’/ zeros'(就像我在阅读文件时使用h5py一样)而没有运气.

如果我使用pandas.hdfstore读取它,我会得到一个空的商店:

store = pd.hdfstore('test.h5')
>>> store
<class 'pandas.io.pytables.hdfstore'>
File path: test.h5
Empty

用h5py读取刚刚创建的文件没有麻烦:

h5_back = h5py.File('test.h5', 'r')
h5_back['/zeros']
<HDF5 dataset "zeros": shape (3, 5), type "<f4">

使用这些版本:

Python 3.4.3 (v3.4.3:9b73f1c3e601, Feb 23 2015, 02:52:03) 
[GCC 4.2.1 (Apple Inc. build 5666) (dot 3)] on darwin

pd.__version__
'0.16.2'
h5py.__version__
'2.5.0'

提前谢谢了,
马沙

解决方法:

我在pandas.io上的pytables模块上做了一点工作,据我所知,pandas与HDF文件的交互仅限于熊猫理解的特定结构.要查看它们的外观,您可以尝试

import pandas as pd
import numpy as np
pd.Series(np.zeros((3,5),dtype=np.float32).to_hdf('test.h5','test')

如果在HDFView中打开“test.h5”,您将看到一个路径/测试,其中包含重新创建DataFrame所需的4个项目.

HDFView of test.h5

所以我认为你在NumPy数组中读取的唯一选择是直接读取它们然后将它们转换为Pandas对象.

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐