微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python – 在数据框中创建一个列,该列是一个字符串,用于汇总其他列中的数据

我有一个像这样的数据框,其中列是一些指标的分数:

A B C D  
4 3 3 1  
2 5 2 2  
3 5 2 4  

我想创建一个新列,使用列名作为字符串,总结每行在设定阈值上得分的指标.因此,如果阈值是A> 2,B> 3,C> 1,D> 3,我希望新列看起来像这样:

A B C D NewCol  
4 3 3 1 AC  
2 5 2 2 BC  
3 5 2 4 ABCD  

我尝试使用一系列np.where:

df[NewCol] = np.where(df['A'] > 2, 'A', '')  
df[NewCol] = np.where(df['B'] > 3, 'B', '')

等等

但实现结果是在所有四个指标都不符合条件的情况下用最后一个指标覆盖,如下所示:

A B C D NewCol  
4 3 3 1 C  
2 5 2 2 C  
3 5 2 4 ABCD  

我很确定有一种更简单,更正确的方法.

解决方法:

你可以这样做:

import pandas as pd

data = [[4, 3, 3, 1],
        [2, 5, 2, 2],
        [3, 5, 2, 4]]

df = pd.DataFrame(data=data, columns=['A', 'B', 'C', 'D'])

th = {'A': 2, 'B': 3, 'C': 1, 'D': 3}

df['result'] = [''.join(k for k in df.columns if record[k] > th[k]) for record in df.to_dict('records')]

print(df)

产量

   A  B  C  D result
0  4  3  3  1     AC
1  2  5  2  2     BC
2  3  5  2  4   ABCD

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐