微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python – 根据第2列中的不同值获取行

我是熊猫的新手,尝试在谷歌搜索这个但仍然没有运气.如何通过column2中的不同值获取行?

例如,我有以下数据框:

>>> df
COL1   COL2
a.com  22
b.com  45
c.com  34
e.com  45
f.com  56
g.com  22
h.com  45

我想根据COL2中的唯一值获取

>>> df
COL1  COL2
a.com 22
b.com 45
c.com 34
f.com 56

那么,我该怎么做呢?如果有人能提供任何帮助,我将非常感激.

解决方法:

使用drop_duplicates指定列COL2进行检查重复:

df = df.drop_duplicates('COL2')
#same as
#df = df.drop_duplicates('COL2', keep='first')
print (df)
    COL1  COL2
0  a.com    22
1  b.com    45
2  c.com    34
4  f.com    56

您也可以只保留最后的值:

df = df.drop_duplicates('COL2', keep='last')
print (df)
    COL1  COL2
2  c.com    34
4  f.com    56
5  g.com    22
6  h.com    45

删除所有重复项:

df = df.drop_duplicates('COL2', keep=False)
print (df)
    COL1  COL2
2  c.com    34
4  f.com    56

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐