微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python – 如何使用pandas对条件进行采样?

我有一个数据帧df,如下所示:

   Col1      Col2
0  1         T
1  1         B 
2  3         S
3  2         A
4  1         C
5  2         A
etc...

我想创建两个数据帧:df1是10行的随机样本,这样Col2 ==’T’. df2是df减去df1中的行.

解决方法:

假设你有一个唯一索引的数据框(如果你没有,你可以简单地做.reset_index(),应用这个,然后在事后设置set_index),你可以使用DataFrame.sample. [实际上,你应该可以使用样本即使框架没有唯一索引,但您无法使用以下方法获取df2.]

请注意,在此示例中我使用的是A而不是T,因为A是您给出的示例中Col2的唯一重复值,我只会随机选择1而不是10.

>>> df1 = df[df.Col2 == "A"].sample(1)
>>> df2 = df[~df.index.isin(df1.index)]
>>> df1
   Col1 Col2
3     2    A
>>> df2
   Col1 Col2
0     1    T
1     1    B
2     3    S
4     1    C
5     2    A

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐