微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Pandas / Python将两个数据帧组合在一起,形成重复的行

好吧,这似乎应该很容易与合并或连接操作,但我不能破解它.我在熊猫工作.

我有两个数据帧,它们之间有重复的行,我希望以不重复行或列的方式组合它们.它会像这样工作

df1:

A B 
a 1
b 2
c 3

df2:

A B 
b 2
c 3
d 4

df3 = df1 combined with df2

A B 
a 1
b 2
c 3
d 4

我尝试过的一些方法是选择一个但不是另一个的行(一个XOR),然后追加它们,但我无法弄清楚如何进行选择.我的另一个想法是追加它们并删除重复的行,但我不知道如何做后者.

解决方法:

你想要一个outer merge

In [103]:
df1.merge(df2, how='outer')

Out[103]:
   A  B
0  a  1
1  b  2
2  c  3
3  d  4

上面的工作原理是它自然地在两个dfs之间找到公共列并指定合并类型导致df具有所需的组合列的并集.

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐