想想下表
np.random.seed(42)
ix = pd.date_range('2017-01-01', '2017-01-15', freq='60s')
df = pd.DataFrame(
{
'val': np.random.random(size=ix.shape[0]),
'active': np.random.choice([0,1], size=ix.shape[0])
},
index=ix
)
df.sample(10)
收益:
active val
2017-01-02 06:05:00 1 0.774654
2017-01-04 08:15:00 1 0.934796
2017-01-13 01:02:00 0 0.792351...
我的目标是计算:
>每天总和
>每天活动量的总和
每日总和这个很简单:
gb = df.groupby(pd.to_datetime(df.index.date))
overall_sum_per_day = gb['val'].sum().rename('overall')
每个活动日的总和这有点棘手(见this).
active_sum_per_day = gb.agg(lambda x: x[x.active==1]['val'].sum())['val'].rename('active')
我的问题如何将两者结合起来.使用concat:
pd.concat([overall_sum_per_day, active_sum_per_day], axis=1)
我可以实现我的目标.但我没有一次完成它并立即应用这两个聚合.可能吗?见comment.
解决方法:
你可以使用GroupBy.apply
:
b = gb.apply(lambda x: pd.Series([x['val'].sum(), x.loc[x.active==1, 'val'].sum()],
index=['overall', 'active']))
print (b)
overall active
2017-01-01 715.997165 366.856234
2017-01-02 720.101832 355.100828
2017-01-03 711.247370 335.231948
2017-01-04 713.688122 338.088299
2017-01-05 716.127970 342.889442
2017-01-06 697.319129 338.741027
2017-01-07 708.121948 361.086977
2017-01-08 731.032093 370.697884
2017-01-09 718.386679 342.162494
2017-01-10 709.706473 349.657514
2017-01-11 720.477342 368.407343
2017-01-12 738.286682 378.618305
2017-01-13 735.805583 372.039108
2017-01-14 727.502271 345.612816
2017-01-15 0.613559 0.613559
另一种方案:
b = gb.agg(lambda x: [x['val'].sum(), x.loc[x.active==1, 'val'].sum()])
.rename(columns={'val':'overall'})
print (b)
active overall
2017-01-01 715.997165 366.856234
2017-01-02 720.101832 355.100828
2017-01-03 711.247370 335.231948
2017-01-04 713.688122 338.088299
2017-01-05 716.127970 342.889442
2017-01-06 697.319129 338.741027
2017-01-07 708.121948 361.086977
2017-01-08 731.032093 370.697884
2017-01-09 718.386679 342.162494
2017-01-10 709.706473 349.657514
2017-01-11 720.477342 368.407343
2017-01-12 738.286682 378.618305
2017-01-13 735.805583 372.039108
2017-01-14 727.502271 345.612816
2017-01-15 0.613559 0.613559
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。