微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python – Pandas中的窗口重叠

在pandas中,有几种方法可以在给定窗口中操作数据(例如pd.rolling_mean或pd.rolling_std.)但是,我想设置一个窗口重叠,我认为这是一个非常标准的要求.例如,在下图中,您可以看到一个跨越256个样本并重叠128个样本的窗口.

如何使用Pandas或Numpy中包含的优化方法来做到这一点?

解决方法:

使用as_strided你会做这样的事情:

import numpy as np
from numpy.lib.stride_tricks import as_strided

def windowed_view(arr, window, overlap):
    arr = np.asarray(arr)
    window_step = window - overlap
    new_shape = arr.shape[:-1] + ((arr.shape[-1] - overlap) // window_step,
                                  window)
    new_strides = (arr.strides[:-1] + (window_step * arr.strides[-1],) +
                   arr.strides[-1:])
    return as_strided(arr, shape=new_shape, strides=new_strides)

如果将一维数组传递给上面的函数,它将返回一个2D视图到该数组,其形状为(number_of_windows,window_size),因此您可以计算,例如窗口意味着:

win_avg = np.mean(windowed_view(arr, win_size, win_overlap), axis=-1)

例如:

>>> a = np.arange(16)
>>> windowed_view(a, 4, 2)
array([[ 0,  1,  2,  3],
       [ 2,  3,  4,  5],
       [ 4,  5,  6,  7],
       [ 6,  7,  8,  9],
       [ 8,  9, 10, 11],
       [10, 11, 12, 13],
       [12, 13, 14, 15]])
>>> windowed_view(a, 4, 1)
array([[ 0,  1,  2,  3],
       [ 3,  4,  5,  6],
       [ 6,  7,  8,  9],
       [ 9, 10, 11, 12],
       [12, 13, 14, 15]])

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐