我刚拿起大熊猫,以为它能让我在python中很好地进行数据分析.现在我有一个以下形式的pandas数据框:
pandas.DataFrame({"p1": [1, 1, 2, 2, 3, 3]*2,
"p2": [1]*6+[2]*6,
"run": [1, 2]*6,
"result": xrange(12)})
p1 p2 result run
0 1 1 0 1
1 1 1 1 2
2 2 1 2 1
3 2 1 3 2
4 3 1 4 1
5 3 1 5 2
6 1 2 6 1
7 1 2 7 2
8 2 2 8 1
9 2 2 9 2
10 3 2 10 1
11 3 2 11 2
我想为每组参数p1和p2生成一个包含一个条目的框架,其中包含这些参数的所有结果值的平均值,即
p1 p2 result
0 1 1 0.5
1 2 1 2.5
2 3 1 4.5
3 1 2 6.5
4 2 2 8.5
5 3 2 10.5
大熊猫的做法是什么?我会尝试复制原始表,删除不同的列(结果和运行),重新索引,将新索引再次组合为多索引,然后运行该外部多索引级别的均值方法.是这样做的,如果是,我如何在代码中正确地做这些索引?
解决方法:
你可以使用groupby(我已经调用了你的数据帧df):
df.groupby(['p1', 'p2']).mean()
这会产生MultiIndex DataFrame.要获得问题中的布局,请仅选择所需的列并重置索引:
df.groupby(['p1', 'p2']).mean()['result'].reset_index()
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。