微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python – 以一定的开始时间重新采样每小时一次的TimeSeries

我想在某个小时开始每天(恰好24小时)频繁重新采样TimeSeries.

喜欢:

index = date_range(datetime(2012,1,1,17), freq='H', periods=60)

ts = Series(data=[1]*60, index=index)

ts.resample(rule='D', how='sum', closed='left', label='left')

结果我得到:

2012-01-01  7
2012-01-02 24
2012-01-03 24
2012-01-04  5
Freq: D

结果我希望:

2012-01-01 17:00:00 24
2012-01-02 17:00:00 24
2012-01-03 17:00:00 12
Freq: D

几周前你可以将’24H’传递给freq参数,它完全没问题.
但现在它将’24H’与’1D’结合起来.

我是否正在使用现在修复的“24H”错误
我怎样才能以高效和pythonic(或熊猫)的方式获得希望的结果呢?

版本:

> python 2.7.3
> pandas 0.9.0rc1(但在0.8.1中也不起作用)
> numpy 1.6.1

解决方法:

Resample一个基本参数,涵盖了这种情况:

ts.resample(rule='24H', closed='left', label='left', base=17).sum()

输出

2012-01-01 17:00:00    24
2012-01-02 17:00:00    24
2012-01-03 17:00:00    12
Freq: 24H

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐