微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python – 输出pandas分组的数据帧没有聚合

假设我有一个带有’A’,’B’,’C’作为列名的pandas DF

A    B   C 
a1  b11 c11
a1  b12 c12
a2  b21 c21
a2  b22 c22

我可以按’A’分组,但我可以得到

A  B  C
a1 [b11,b12], [c11,c12]
a2 [b21,b22], [c21,c22]

没有任何聚合?希望订单(b12之前的b11)保留在原始表中.

解决方法:

我不知道怎么做你想要的,但也许这足够接近:

In [23]: df = pd.DataFrame({'A' : ['a1', 'a1', 'a2', 'a2'],
                            'B' : ['b11', 'b12', 'b21', 'b22'],
                            'C' : ['c11', 'c12', 'c21', 'c22']})

In [24]: grpA  = df.groupby('A')
In [25]: a1 = grpA.get_group('a1')

使用它然后我得到:

In [26]: a1['B']  # or a1.B
Out[26]: 
0    b11
1    b12
Name: B

也:

In [39]: import numpy as np

In [40]: np.array(a1.B)
Out[40]: array([b11, b12], dtype=object)

最后:

In [41]: grpdA.get_group('a1').B.tolist()  # leave off `.tolist()` to get a series
Out[41]: ['b11', 'b12']

希望有所帮助.

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐