从我读过的内容中,可以很容易地从DataFrame添加和删除列,但我想知道是否已经有一种方法可以实现我想要实现的目标,以避免重新发明轮子.
假设我有DataFrame x:
a b c
0 1 5 8
1 2 6 9
2 3 7 10
我想验证列名是否仅对应于列表l中包含的元素.例如,l中的元素比x中的列少,我希望删除缺少的列.
例如,如果l = [“a”,“b”],则x将变为:
a c
0 1 8
1 2 9
2 3 10
另一方面,如果l中的元素多于x中的列,我想创建新的,相应命名的列,并将该列上的所有值设置为0.
例如,如果l = [“a”,“b”,“c”,“d”],则x将变为:
a b c d
0 1 5 8 0
1 2 6 9 0
2 3 7 10 0
我可以做一个循环来检查x中的列名和l中的元素之间的一致性,但是有什么比这更有效吗?
解决方法:
只需使用(添加.astype(np.int),感谢@Bill,如果需要的话.请注意,这会将整个数据帧转换为整数):
df.loc[:, l].fillna(0).astype(np.int)
情况1:
l = ["a", "b"]
df.loc[:, l].fillna(0).astype(np.int)
a b
0 1 5
1 2 6
2 3 7
案例2:
l = ["a", "b", "c", "d"]
df.loc[:, l].fillna(0).astype(np.int)
a b c d
0 1 5 8 0
1 2 6 9 0
2 3 7 10 0
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。