微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

如何在没有迭代的情况下基于Pandas中的2个条件创建新的df.column?

我有正常的df

 A = pd.DataFrame([[1, 5, 2], [2, 4, 4], [3, 3, 1], [4, 2, 2], [5, 1, 4]],
                  columns=['A', 'B', 'C'], index=[1, 2, 3, 4, 5])

如果我想根据另一列中的条件创建一个列,我会做这样的事情,并按预期工作.

 In [5]: A['D'] = A['C'] > 2
 In [6]: A
 Out[6]: 
   A  B  C      D
1  1  5  2  False
2  2  4  4   True
3  3  3  1  False
4  4  2  2  False
5  5  1  4   True

但是,如果我想使用两个条件做同样的事情……比如:

A['D'] = A['C'] > 2 and A['B'] > 2      or     A['D'] = A['C'] > 2 & A['B'] > 2

我臭名昭着

ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().

如何在没有迭代的情况下解决?基于两个条件创建此新列的目的是能够使用类型的groupby函数

A.groupby('D').apply(custom_fuction)

所以,也许有一种方法可以使用groupby来完成整个过程,但我不知道该怎么做.

谢谢

解决方法:

使用&,not和,执行元素逻辑和操作:

In [40]: A['D'] = (A['C'] > 2) & (A['B'] > 2)

In [41]: A
Out[41]: 
   A  B  C      D
1  1  5  2  False
2  2  4  4   True
3  3  3  1  False
4  4  2  2  False
5  5  1  4  False

您也可以跳过定义D列:

In [42]: A.groupby((A['C'] > 2) & (A['B'] > 2))
Out[42]: <pandas.core.groupby.DataFrameGroupBy object at 0xab5b6ac>

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐