微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

在python pandas dataframe中找出一行值与剩余行值的差异

初始数据帧:

df = 
             Index   Nature  Interval
0            0       1       0.000000
1            1       1       0.999627
2            2       1       1.000607
3            3       1       1.000612

参赛作品总数约为700,000.

有没有办法找到“Interval”列中的一个元素与同一列中所有剩余元素之间的差异,并且必须对剩余的数据帧执行相同的操作.

我找到了解决此问题的方法.片段是

df["Potential"] = df["Interval"].apply(lambda x:print(np.sum([math.exp(-4 * abs(x - val)) for val in df['Interval']])))

然而,它需要花费太多时间,因为使用了for循环.

那么有什么方法可以优化解决方案.

解决方法:

您可以使用申请:

b = df["Interval"].apply(lambda x: np.sum(np.exp(-4 * (x - df.Interval).abs())))
print (b)
0    1.054885
1    3.010498
2    3.014339
3    3.014319
Name: Interval, dtype: float64

Numpy解决方案subract将Intrval列的值重新整形为’row’,然后应用abs,np.exp和np.sum:

val = df.Interval.values
arr = np.sum(np.exp(-4*abs(val-val.reshape(len(df.index),-1))), axis=0)
print (arr)
[ 1.05488507  3.01049841  3.0143389   3.01431861]

df["Potential"] = arr
print (df)
   Index  Nature  Interval  Potential
0      0       1  0.000000   1.054885
1      1       1  0.999627   3.010498
2      2       1  1.000607   3.014339
3      3       1  1.000612   3.014319

一个numpy解决方案,谢谢pirsquared:

i = df.Interval.values
print (np.exp((np.abs(i[:, None] - i)) * -4).sum(1))
[ 1.05488507  3.01049841  3.0143389   3.01431861]

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐