微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python – 可以用字符串列创建稀疏的Pandas DataFrame吗?

是否可以创建一个稀疏的Pandas DataFrame,其中的列都包含浮点数和字符串?
即,我有一个数据帧:

df2 = pd.DataFrame({'A':[0., 1., 2., 0.], 
                    'B': ['a','b','c','d']}, columns=['A','B'])

我想将其转换为稀疏数据帧,但df2.to_sparse(fill_value = 0.)给出:

ValueError: Could not convert string to float: d

有没有办法让这项工作?

解决方法:

你可以做的是将你的字符串映射到ints / floats并将你的列B映射到他们的dict查找值到一个新的列C然后创建稀疏的数据帧,如下所示:

temp={}
# we want just the unique values here for the dict
for x in enumerate(df2['B'].unique().tolist()):
    val, key = x
    temp[key]=val
temp

Out[106]:
{'a': 0, 'b': 1, 'c': 2, 'd': 3}

# Now add this column

In [108]:

df2['C']=df2['B'].map(temp)
df2
Out[108]:
   A  B  C
0  0  a  0
1  1  b  1
2  2  c  2
3  0  d  3

# Now pass the two columns to create the sparse matrix:

In [109]:

df2[['A', 'C',]].to_sparse(fill_value=0)
Out[109]:
   A  C
0  0  0
1  1  1
2  2  2
3  0  3

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐