我有两个数据框如下:
A = pd.DataFrame({"value":[3, 7, 5 ,18,23,27,21,29]})
B = pd.DataFrame({"low":[1, 6, 11 ,16,21,26], "high":[5,10,15,20,25,30], "name":["one","two","three","four","five", "six"]})
我想知道A中的“值”是否在B中的“高”和“低”之间,如果是,我想将列名从B复制到A.
输出应如下所示:
A = pd.DataFrame({"value":[3, 7, 5 ,18,23,27,21,29], "name":["one","two","one","four","five", "six", "five", "six"]})
我的函数使用iterrows如下:
def func1(row):
x = row['value']
for index,value in B.iterrows():
if ((value['low'] <= x) &(x<=value['high'])):
return value['name']
但它还没有实现我想做的事情,
谢谢,
解决方法:
您可以使用列表推导来迭代A中的值,然后使用loc来获取相关的映射值. le小于或等于,且ge大于或等于.
例如,第一行中v = 3.使用简单的布尔索引:
>>> B[(B['low'].le(v)) & (B['high'].ge(v))]
high low name
0 5 1 one
假设DataFrame B没有任何重叠范围,那么您将返回上面的一行.然后使用loc获取名称列,如下所示.因为每个返回的名称都是一个系列,所以您需要获取第一个和唯一的标量值(例如,使用iat).
A['name'] = [B.loc[(B['low'].le(v)) & (B['high'].ge(v)), 'name'].iat[0]
for v in A['value']]
>>> A
value name
0 3 one
1 7 two
2 5 one
3 18 four
4 23 five
5 27 six
6 21 five
7 29 six
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。