我试图在我的数据帧(标题)的某一列中找到部分字符串匹配.理想情况下,如果部分字符串匹配为true,我希望pandas创建一个真正的false列,如果字符串匹配为false,我希望创建一个false.我想为你做一个def函数来创建一个if / else语句,因为我的数据集非常大.
如果“标题”列中包含“狗”字样,则在我的新列“匹配”中将该行放入true.
Old Dataframe example:
Title Author Name
Dogs R Us John Smith
Pigs can Fly Henry White
Dog Games Adam James
New Dataframe example:
Title Author Name Match
Dogs R Us John Smith True
Pigs can Fly Henry White False
Dog Games Adam James True
解决方法:
使用str.contains
In [832]: df.Title.str.contains('Dog')
Out[832]:
0 True
1 False
2 True
Name: Title, dtype: bool
In [833]: df['Match'] = df.Title.str.contains('Dog')
In [834]: df
Out[834]:
Title Author Name Match
0 Dogs R Us John Smith True
1 Pigs can Fly Henry White False
2 Dog Games Adam James True
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。