微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Python怎么使用flashtext数据清洗工具?Python如何使用flashtext替换字符

python程序开发之中经常需要去做的一个事情就是数据处理,而数据处理中对字符串这种类型的操作可以说是最频繁的了。而下面这一篇文章会来详细讲解一下,该怎么使用flashtext这个工具完成数据清洗操作,感兴趣的小伙伴可以一起往下看看。

一、安装工具

flashtext虽然说是一个工具,但是它是可以作为模块来导入使用,并且用pip命令就能下载安装好。使用win+r快捷方式打开运行窗口,然后输入cmd并回车即可以管理员身份打开命令提示符,接着使用国内清华镜像源安装该工具,示例如下:

pip install flashtext -i https://pypi.tuna.tsinghua.edu.cn/simple

二、使用flashtext工具

那么使用它来玩数据清洗操作实际上就分为两步,第一步是将需要清洗的数据,也就是关键词添加到处理器词库之中,代码示例如下所示:

from flashtext import KeywordProcessor
processor = KeywordProcessor()
processor.add_keyword('Python')

添加完成之后该词库之中就是已经保存了该关键词,接下来所有的操作都是围绕这个关键词来完成,因为字符串类型对象数据清洗就是取出其中的关键词以及替换关键词两种方式。

那么提取关键词的方法也很简单,只需要使用这个对象去调用extract方法并且传入字符串类型对象作为参数,就可以把该对象中所有的关键词取出来,示例如下所示:

found = processor.extract_keywords('I like Python and Scala.')
print(found)

另外一种方法就是在字符串对象中匹配到词库内所有的关键词,然后使用别名来替换该关键词。需要在添加关键词时写上两个参数,代码如下所示:

processor.add_keyword('Scala', 'Java')
replaced = processor.replace_keywords('I like Scala.')

以上就是关于“Python怎么使用flashtext数据清洗工具?Python如何使用flashtext替换字符”的全部内容了,希望对你有所帮助。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐