微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

将多个列值合并到python pandas中的一列中

我有一个像这样的pandas数据框:

   Column1  Column2  Column3  Column4  Column5
 0    a        1        2        3        4
 1    a        3        4        5
 2    b        6        7        8
 3    c        7        7        

我现在要做的是获取一个包含Column1和新columnA的新数据帧.此列A应包含第2列的所有值 – (到)n(其中n是从Column2到行尾的列数),如下所示:

  Column1  ColumnA
0   a      1,2,3,4
1   a      3,4,5
2   b      6,7,8
3   c      7,7

我怎样才能最好地解决这个问题?任何意见将是有益的.提前致谢!

解决方法:

您可以调用apply pass axis = 1来逐行应用,然后将dtype转换为str并加入:

In [153]:
df['ColumnA'] = df[df.columns[1:]].apply(
    lambda x: ','.join(x.dropna().astype(str)),
    axis=1
)
df

Out[153]:
  Column1  Column2  Column3  Column4  Column5  ColumnA
0       a        1        2        3        4  1,2,3,4
1       a        3        4        5      NaN    3,4,5
2       b        6        7        8      NaN    6,7,8
3       c        7        7      NaN      NaN      7,7

在这里调用dropna来摆脱NaN,但是我们需要再次强制转换为int,所以我们最终不会将float作为str.

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐