微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

正则表达式匹配中文

现在基本所有的编程语言都支持中文代码认是用unicode来处理字符串,所以中文和unicode是等价的,所以正则表达式中匹配中文可以用unicode码来代替

1、如果你想匹配特定的中文,比如 :你好,你可以直接用中文 你好来匹配

比如想匹配 hello你好 中的你好两个中文,可以写成

你好

也可以把你好先转换成unicode码

\u4f60\u597d

上面两种是等价的

2、但是你想匹配出一段文本中的所有中文字符,就只能用unicode码了,因为你无法穷尽所有的中文

[\u4e00-\u9fa5]+

如果报错,把\转义就可以了

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐