微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python – 熊猫操纵一列到一个新列

如何将熊猫柱的复杂操作变为新列?
例如:

import pandas as pd
import ast

d = {'col1' : pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd']), 
     'col2' : pd.Series(['[9, 10]', '[10, 11]', '[11, 12]', '[12,13]'],
              index=['a', 'b', 'c', 'd'])
    }
df = pd.DataFrame(d)
print(df)

所以最后一列实际上是一个字符串,但我想将其转换为列表.

我试过了:

df['new'] = ast.literal_eval(df['col2')

这会引发错误.

我已经尝试了很多其他的东西,无法得到任何工作.

我想还有另一种方法来回答这个问题:

在之前的文件中,我创建了我的df,列表是列的元素,然后保存到csv.当我打开csv文件时,列表被解释为字符串.因此,另一种解决方案是以保留列表的方式保存原始熊猫.

解决方法:

json.loads有效,因为你的列表是有效的json.您可以使用已在pandas中导入的json

df.assign(new=df.col2.apply(pd.io.json.loads))

   col1      col2       new
a     1   [9, 10]   [9, 10]
b     2  [10, 11]  [10, 11]
c     3  [11, 12]  [11, 12]
d     4   [12,13]  [12, 13]

print(type(df.assign(new=df.col2.apply(pd.io.json.loads)).iloc[0, -1]))

<class 'list'>

无论出于何种原因,json解析似乎比literal_eval更快

%timeit df.assign(new=df.col2.apply(pd.io.json.loads))
%timeit df.assign(new=df.col2.apply(literal_eval))
%timeit df.assign(new=[ast.literal_eval(x) for x in df['col2']])

小数据

1000 loops, best of 3: 410 µs per loop
1000 loops, best of 3: 468 µs per loop
1000 loops, best of 3: 397 µs per loop

大数据

df = pd.concat([df] * 10000, ignore_index=True)

100 loops, best of 3: 17.9 ms per loop
1 loop, best of 3: 333 ms per loop
1 loop, best of 3: 331 ms per loop

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐