假设我有以下多索引DataFrame:
import pandas as pd
df = pd.DataFrame({'Index0':[0,1,2,3,4,5],'Index1':[100,200,300,400,500,600],'A':[5,2,5,8,1,2]})
现在我想选择Index1小于400的所有行.
如果Index1是常规列,每个人都知道它是如何工作的:
df[df['Index1'] < 400]
因此,一种方法是reset_index,执行选择,然后再次设置索引.这似乎很多余.
我的问题是:有没有办法直接这样做?当DataFrame有行多索引时如何做到这一点?
解决方法:
最简单的是使用query
:
df1 = df.query('Index1 < 400')
print (df1)
A
Index0 Index1
0 100 5
1 200 2
2 300 5
或get_level_values
选择级别的MultiIndex与boolean indexing
:
df1 = df[df.index.get_level_values('Index1') < 400]
详情:
print (df.index.get_level_values('Index1'))
Int64Index([100, 200, 300, 400, 500, 600], dtype='int64', name='Index1')
如果级别没有按位置选择名称,则查询使用特殊关键字ilevel_ with position:
df.index.names = [None, None]
print (df)
A
0 100 5
1 200 2
2 300 5
3 400 8
4 500 1
5 600 2
df1 = df.query('ilevel_1 < 400')
df1 = df[df.index.get_level_values(1) < 400]
print (df1)
A
0 100 5
1 200 2
2 300 5
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。