微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

两列Python之间的关系

我正在尝试找出如何确定数据框中两列之间的关系.关系是项目和总计之间的关系.我想计算每个’项目’值的总金额,其中项目是每个篮子的项目数,总计是每个篮子的总金额/成本.专栏:

    Date   Time    Basket   Items   Total

我目前用于获取项目数的每个频率的Python代码是:

items  = result['Items'].value_counts()

我已经尝试过这段代码来获得总数(以及其他…):

Total_per_Items = result.groupby(['Items','Total'])
Totals = Total_per_Items['Total'].sum()
Totals

得到这个输出

Items  Total 
1  0.00        0.00
   0.01        0.03
   0.02        0.02
   0.11        0.11
   0.22        0.22
   0.24        0.24
   0.28        0.28
   0.29        0.29

相反,我希望得到类似的东西:

Items    Total
1        10500.65
2        2300.50
3        3450.34

我编制了上面的输出,但我相信你会得到漂移.它让我被烘烤了.

解决方法:

这将为您提供项目总计:

result.groupby(['Items'])['Total'].sum()

例:

>>> result = pd.DataFrame({'Items': [1, 2, 3, 2, 1, 2, 3],
                           'Total': [10, 20, 30, 20, 10, 20, 30]})
>>> result.groupby(['Items'])['Total'].sum()
Items
1    20
2    60
3    60
Name: Total, dtype: int64

这为您提供了一个数据帧:

>>> result.groupby(['Items'])['Total'].sum().to_frame()

       Total
Items       
1         20
2         60
3         60

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐