好吧,这似乎应该很容易与合并或连接操作,但我不能破解它.我在熊猫工作.
我有两个数据帧,它们之间有重复的行,我希望以不重复行或列的方式组合它们.它会像这样工作
df1:
A B
a 1
b 2
c 3
df2:
A B
b 2
c 3
d 4
df3 = df1 combined with df2
A B
a 1
b 2
c 3
d 4
我尝试过的一些方法是选择一个但不是另一个的行(一个XOR),然后追加它们,但我无法弄清楚如何进行选择.我的另一个想法是追加它们并删除重复的行,但我不知道如何做后者.
解决方法:
你想要一个outer
merge
:
In [103]:
df1.merge(df2, how='outer')
Out[103]:
A B
0 a 1
1 b 2
2 c 3
3 d 4
上面的工作原理是它自然地在两个dfs之间找到公共列并指定合并类型导致df具有所需的组合列的并集.
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。