我正在尝试找出如何确定数据框中两列之间的关系.关系是项目和总计之间的关系.我想计算每个’项目’值的总金额,其中项目是每个篮子的项目数,总计是每个篮子的总金额/成本.专栏:
Date Time Basket Items Total
items = result['Items'].value_counts()
我已经尝试过这段代码来获得总数(以及其他…):
Total_per_Items = result.groupby(['Items','Total'])
Totals = Total_per_Items['Total'].sum()
Totals
得到这个输出:
Items Total
1 0.00 0.00
0.01 0.03
0.02 0.02
0.11 0.11
0.22 0.22
0.24 0.24
0.28 0.28
0.29 0.29
相反,我希望得到类似的东西:
Items Total
1 10500.65
2 2300.50
3 3450.34
我编制了上面的输出,但我相信你会得到漂移.它让我被烘烤了.
解决方法:
这将为您提供项目总计:
result.groupby(['Items'])['Total'].sum()
例:
>>> result = pd.DataFrame({'Items': [1, 2, 3, 2, 1, 2, 3],
'Total': [10, 20, 30, 20, 10, 20, 30]})
>>> result.groupby(['Items'])['Total'].sum()
Items
1 20
2 60
3 60
Name: Total, dtype: int64
这为您提供了一个数据帧:
>>> result.groupby(['Items'])['Total'].sum().to_frame()
Total
Items
1 20
2 60
3 60
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。