AI导航网

技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

PHPPCRE正则解析

时间：2020-07-24分类：正则表达式作者：编程之家

一、前言

前面的博客里，有对字符集的解析。这里就不是字符集的事儿了，在PHP中很多函数的处理默认是unicode中的UTF-8编码格式。那么废话不多说，直接开始正题。

二、PHP 函数mb_split解析

1 <?PHP
2 $preg_strings = ‘测、试、一、下‘;
3 $preg_str = mb_split(‘、‘,$preg_strings);
4 print_r($preg_str);

打印结果：

Array
(
    [0] => 测
    [1] => 试
    [2] => 一
    [3] => 下
)

此函数默认底层解析，以UTF-8的编码格式解析。以分隔符（、）的UNICODE的16进制码点分割字符$preg_strings。

三、PHP 函数preg_split解析

分割字符串“测试一下”

1 <?PHP
2 $strings = ‘测试一下‘;
3 $mb_arr = preg_split(‘//u‘,$strings,-1, PREG_SPLIT_NO_EMPTY);
4 print_r($mb_arr);

打印结果如下：

Array
(
    [0] => 测
    [1] => 试
    [2] => 一
    [3] => 下
)

四、PCRE中的/u解析

在PHP中，正则的定界符可以为#、%、/等等。

在一个正则中有时后面会有些修饰符。那么他们都是什么意思呢？

比如：

%[\x{4e00}-\x{9fa5}]+%u

其中后面的修饰符u代码表以正则匹配以utf-8的编码格式匹配。

例子一：

1 <?PHP
2 $strings = ‘测试一下‘;
3 $is_true = preg_match_all(‘%[\x{4e00}-\x{9fa5}]+%u‘,$match);
4 var_dump($is_true);

打印结果如下：

Array
(
    [0] => Array
        (
            [0] => 测试一下
        )

)

这里的[\x{4e00}-\x{9fa5}]是什么意思呢？

在PHP正则中\x用来表示16进制。

中文的UNICODE码点在4E00 - 9FFF （这里说的都是16进制）

所以，正则匹配写法就是区间[]，[\x{4E00}-\x{9FFF}]

这两个正则的效果都是一样的。

五、尾言

今天的随笔到这就完事了，借此分享。

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 [email protected] 举报，一经查实，本站将立刻删除。

相关推荐

正则替换html代码中img标签的src值

正则替换html代码中img标签的src值在开发富文本信息在移动端展示的项目中，难免会遇到后台返回的标签文本信息中img标签src属性按照相对或者绝对路径返回的形式，类似：<img src="qinhancity/v1.0.0/ima

作者：嘻嘻哈哈biubiubiu 时间：2023-03-03

【C++】正则表达式

正则表达式

作者：Scott.L 时间：2022-12-20

shell之三剑客awk基础用法

AWK是一种处理文本文件的语言，是一个强大的文件分析工具。它是专门为文本处理设计的编程语言，也是行处理软件，通常用于扫描，过滤，统计汇总等工作，数据可以来自标准输入也可以是管道或文件。当读到第一行时，匹配...

作者：yu.deqiang 时间：2022-12-19

正则表达式

正则表达式是特殊的字符序列，利用事先定义好的特定字符以及他们的组合组成了一个规则，然后检查一个字符串是否与这种规则匹配来实现对字符的过滤或匹配。我们刚才在学习正则表达式的时候，我们表示数字，字母下划线...

作者：熬夜磕代码丶时间：2022-12-19

Python基础知识进阶之正则表达式

Python界一名小学生，热心分享编程学习。

作者：漫步桔田时间：2022-12-19

开发者神器，代码文档终于有救了

收集整理每周优质开发者内容，包括、、等方面。每周五定期发布，同步更新到和。欢迎大家投稿，，推荐或者自荐开源项目/资源/工具/文章~

作者：七步编程时间：2022-11-22

Shell编程从看懂到看开③(函数、echo、printf、test)

本文涉及Shell函数，Shell中的echo、printf、test命令等。

作者：十八岁讨厌编程时间：2022-11-21

正则表达式常用最新版

常用正则表达，包括：密码、手机号、身份证、邮箱、中文、车牌号、微信号、日期 YYYY-MM-DD hh:mm:ss、日期 YYY-MM-DD、十六进制颜色、邮政编号、用户名、 QQ号

作者：Java Fans 时间：2022-11-21

Python正则表达式(持续更新，各种字符串筛选，总有一款适合您当前的功能)

一、python【re】的用法1、re.match函数·单一匹配-推荐指数【★★】2、re.search函数·单一匹配-推荐指数【★★★★★】3、re.findall函数·多项匹配-推荐指数【★★★★★】4、re.finditer函数·多项匹配-推荐指数...

作者：红目香薰时间：2022-11-20

编译原理实验一:词法分析器的自动实现(Lex词法分析)

1.借助词法分析工具Flex或Lex完成（参考网络资源）2.输入：高级语言源代码（如helloworld.c）3.输出：以二元组表示的单词符号序列。通过设计、编制、调试一个具体的词法分析程序，加深对词法分析原理的理解，并掌握在...

作者：zombotany智咏时间：2022-11-19