微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python – pandas:使用.loc和MultiIndex进行条件选择

我已经阅读了Advanced indexing with hierarchical index的文档,其中解释了使用.loc for MultiIndex.也是这个帖子:Using .loc with a MultiIndex in pandas?

我仍然没有看到如何选择行(第一个索引==某个值)或(第二个索引==某个值)

例:

import pandas as pd

index = pd.MultiIndex.from_arrays([['a', 'a', 'a', 'b', 'b', 'b'],
                                  ['a', 'b', 'c', 'a', 'b', 'c']],
                                  names=['i0', 'i1'])
df = pd.DataFrame({'x': [1,2,3,4,5,6], 'y': [6,5,4,3,2,1]}, index=index)

这是DataFrame:

       x  y
i0 i1      
a  a   1  6
   b   2  5
   c   3  4
b  a   4  3
   b   5  2
   c   6  1

如何获取i0 ==’b’或i1 ==’b’的行?

       x  y
i0 i1      
a  b   2  5
b  a   4  3
   b   5  2
   c   6  1

解决方法:

使用get_level_values()

>>> mask = (df.index.get_level_values(0)=='b') | (df.index.get_level_values(1)=='b') 
>>> df[mask]  # same as df.loc[mask]


        x   y
i0  i1      
a   b   2   5
b   a   4   3
    b   5   2
    c   6   1

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐