我有一个数据框,其中有多个列表示某些事物是否存在,但它们本质上是序数的.在所有3个类别中都可能存在某些东西,但我只想表明它存在的最高级别.
所以对于给定的行,我只想要一个’1’值,但我希望它保持在它找到的最高级别.
对于这一行:
1,1,0,我希望将行更改为1,0,0
而这一行:
0,1,1,我希望将行更改为0,1,0
以下是数据外观和预期输出的示例:
import pandas as pd
#input data
df = pd.DataFrame({'id':[1,2,3,4,5],
'level1':[0,0,0,0,1],
'level2':[1,0,1,0,1],
'level3':[0,1,1,1,0]})
#expected output:
new_df = pd.DataFrame({'id':[1,2,3,4,5],
'level1':[0,0,0,0,1],
'level2':[1,0,1,0,0],
'level3':[0,1,0,1,0]})
解决方法:
您可以通过为最大索引分配1来使用get_dummies()
df[df.filter(like='level').columns] = pd.get_dummies(df.filter(like='level').idxmax(1))
id level1 level2 level3
0 1 0 1 0
1 2 0 0 1
2 3 0 1 0
3 4 0 0 1
4 5 1 0 0
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。