微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

python-如何更正Pandas DataFrame中的拼写

使用TextBlob库,可以通过先将字符串定义为TextBlob对象,然后再使用正确的方法来改善字符串的拼写.

例:

from textblob import TextBlob
data = TextBlob('Two raods diverrged in a yullow waod and surry I culd not travl bouth')
print (data.correct())
Two roads diverged in a yellow wood and sorry I Could not travel both

是否可以对像这样的Pandas DataFrame系列中的字符串执行此操作:

data = [{'one': '3', 'two': 'two raods'}, 
         {'one': '7', 'two': 'diverrged in a yullow'}, 
        {'one': '8', 'two': 'waod and surry I'}, 
        {'one': '9', 'two': 'culd not travl bouth'}]
df = pd.DataFrame(data)
df

    one   two
0   3     Two raods
1   7     diverrged in a yullow
2   8     waod and surry I
3   9     culd not travl bouth

返回此:

    one   two
0   3     Two roads
1   7     diverged in a yellow
2   8     wood and sorry I
3   9     Could not travel both

使用TextBlob或其他方法.

解决方法:

您可以执行以下操作:

df.two.apply(lambda txt: ''.join(textblob.TextBlob(txt).correct()))

使用pandas.Series.apply.

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐