微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Python – 以列为单位保留第一个唯一值

我有一个数据框,其中有多个列表示某些事物是否存在,但它们本质上是序数的.在所有3个类别中都可能存在某些东西,但我只想表明它存在的最高级别.

所以对于给定的行,我只想要一个’1’值,但我希望它保持在它找到的最高级别.

对于这一行:
1,1,0,我希望将行更改为1,0,0

而这一行:
0,1,1,我希望将行更改为0,1,0

以下是数据外观和预期输出的示例:

import pandas as pd

#input data
df = pd.DataFrame({'id':[1,2,3,4,5],
                   'level1':[0,0,0,0,1],
                   'level2':[1,0,1,0,1],
                   'level3':[0,1,1,1,0]})

#expected output:
new_df = pd.DataFrame({'id':[1,2,3,4,5],
                   'level1':[0,0,0,0,1],
                   'level2':[1,0,1,0,0],
                   'level3':[0,1,0,1,0]})

解决方法:

您可以通过为最大索引分配1来使用get_dummies()

df[df.filter(like='level').columns] = pd.get_dummies(df.filter(like='level').idxmax(1))

   id  level1  level2  level3
0   1       0       1       0
1   2       0       0       1
2   3       0       1       0
3   4       0       0       1
4   5       1       0       0

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐