微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python – 从不等长度的嵌套列表创建一个pandas数据帧

所以我有一个如下列表:

aa = ['aa1', 'aa2', 'aa3', 'aa4', 'aa5']
bb = ['bb1', 'bb2', 'bb3', 'bb4']
cc = ['cc1', 'cc2', 'cc3']

然后将其创建为嵌套列表:

nest = [aa, bb, cc]

我想创建一个数据帧,如下所示:

aa   bb   cc
aa1  bb1  cc1
aa2  bb2  cc2
aa3  bb3  cc3
aa4  bb4  nan
aa5  nan  nan

我试过了:

pd.DataFrame(nest, columns=['aa', 'bb', cc'])

但结果就是这样,每个列表都被写成一行(而不是列)

解决方法:

itertools的zip_longest函数执行此操作:

>>> import itertools, pandas
>>> pandas.DataFrame((_ for _ in itertools.zip_longest(*nest)), columns=['aa', 'bb', 'cc'])
    aa    bb    cc
0  aa1   bb1   cc1
1  aa2   bb2   cc2
2  aa3   bb3   cc3
3  aa4   bb4  None
4  aa5  None  None

如果您有旧版本的pandas,则可能需要在列表构造函数中包装zip_longest.在较旧的Python上,您可能需要调用izip_longest而不是zip_longest.

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐