微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python – 当子类化DataFrame时如何为’loc’编写包装器方法

我正在尝试为DataFrame的子类编写一个包装器方法

class SubDataFrame(DataFrame):
   ...

a = SubDataFrame()
b = a.loc[row, column]

在最后一行中,我想在处理超类中的loc之前或之后,在SubDataFrame类中单独处理元数据.

我不知道如何实现这种表示法,因为如果我只是定义

def loc(self, *args, **kwargs)

SubDataFrame中的方法loc []括号表示法不起作用. (AttributeError:instancemethod没有属性getitem).

我找不到关于如何实现这个的文档.

解决方法:

不幸的是,Pandas实现索引的方式并不简单.

通常,为了对对象使用索引访问(例如,obj [something]),它需要具有__getitem__和__setitem__方法(参见herehere).

对于DataFrame,loc属性不是方法,而是委托索引的对象:

>>> frame = pd.DataFrame()
>>> type(frame.loc)
pandas.core.indexing._Locindexer

您可以看到类定义here.在这种情况下,_Locindexer从_NDFrameIndexer继承(最终),它定义了索引访问所需的__getitem__和__setitem__方法.

如果你想通过你的子类中的.loc []来拦截访问,你可能必须定义某种代理类,它在传递给原始实现之前实现所需的行为.但我怀疑这将是困难且容易出错的.

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐