微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python – pandas多索引切片“级别类型不匹配”

我从0.13.1移动到pandas版本0.17,我在切片时遇到了一些新的错误.

>>> df
         date  int  data
0  2014-01-01    0     0
1  2014-01-02    1    -1
2  2014-01-03    2    -2
3  2014-01-04    3    -3
4  2014-01-05    4    -4
5  2014-01-06    5    -5
>>> df.set_index("date").ix[datetime.date(2013,12,30):datetime.date(2014,1,3)]
            int  data
date                 
2014-01-01    0     0
2014-01-02    1    -1
2014-01-03    2    -2
>>> df.set_index(["date","int"]).ix[datetime.date(2013,12,30):datetime.date(2014,1,3)]
Traceback (most recent call last):
...
TypeError: Level type mismatch: 2013-12-30

它与0.13.1一起正常工作,并且似乎特定于具有日期的多索引.
在这里做错了吗?

解决方法:

发生此错误的原因是您尝试切片未包含在索引中的日期(标签).要解决此级别不匹配错误并返回在df多索引使用范围内或可能不在df多索引范围内的值:

df.loc[df.index.get_level_values(level = 'date') >= datetime.date(2013,12,30)] 
# You can use a string also i.e. '2013-12-30'

get_level_values()和比较运算符为索引器设置True / False索引值的掩码.

使用字符串或日期对象进行切片通常在Pandas中使用单个索引,无论字符串是否在索引中,但不适用于多索引数据帧.虽然您尝试使用datetime.date(2013,12,30):datetime.date(2014,1,3)set_index调用将索引设置为2013-12-30至2014-01-03,但生成的df索引为从2014-01-01到2014-01-03.为这些日期(包括2013-12-30)设置索引的一种正确方法是使用日期时间对象的字符串将索引设置为日期范围,如:

df.set_index("date").loc[pd.date_range('2013-12-30', '2014-12-03')]

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐