微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

根据Python中数据框中的条件创建包含所有唯一可能组合的列表

我有以下数据集:

d = {
'Company':['A','A','A','A','B','B','B','B','C','C','C','C','D','D','D','D'],
'Individual': [1,2,3,4,1,5,6,7,1,8,9,10,10,11,12,13]
}

现在,我需要在Python中创建一个“公司”元素对的列表,它们对应于“个人”中的值.

例如.对于上面的数据集,上面的输出应如下所示:
((A,B),(A,C),(B,C),(C,D)).前三个元组,因为个人1隶属于A,B和C,最后一个属于个人10隶属于C和D.

进一步说明 –
如果个体= 1,则上述数据集具有“A”,“B”和“C”值.现在,我想创建这三个值(元组)的所有唯一组合,因此它应该创建一个包含元组(A,B),(A,C)和(B,C)的列表.接下来是个人= 2.这里只有值’A’,因此没有元组可以附加到列表中.对于下一个人,每个人只有一个相应的公司,因此没有进一步的配对.必须添加的唯一其他元组是Individual = 10,因为它具有值’C’和’D’ – 因此应该将元组(C,D)添加到列表中.

解决方法:

以下是您提炼问题的解决方案:

from collections import defaultdict
from itertools import combinations

data = {'Company':['A','A','A','A','B','B','B','B','C','C','C','C','D','D','D','D'],
        'Individual': [1,2,3,4,1,5,6,7,1,8,9,10,10,11,12,13]}

d = defaultdict(set)

for i, j in zip(data['Individual'], data['Company']):
    d[i].add(j)

res = {k: sorted(map(sorted, combinations(v, 2))) for k, v in d.items()}

# {1: [['A', 'B'], ['A', 'C'], ['B', 'C']],
#  2: [],
#  3: [],
#  4: [],
#  5: [],
#  6: [],
#  7: [],
#  8: [],
#  9: [],
#  10: [['C', 'D']],
#  11: [],
#  12: [],
#  13: []}

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐