php 正则匹配中文乱码问题_亿码酷站_编程开发技术教程

2020-10-13 技术教程编程开发 0 0 20.8K

详情介绍
常见问题

【亿码酷站-编程开发教程】收集全网优质教程及源码资源！

全网优质软件开发、平面设计等教程及精品源码资源一站可得,www.ymkuzhan.com！

php 正则匹配中文乱码问题_亿码酷站_编程开发技术教程插图

具体问题：

PHP字符串中用正则表达式匹配中文出现乱码

<?php
echo '<h2>正则表达式匹配中文</h2><br>';
$a = '天地不仁，以万物为刍狗';
$b = preg_replace('/万/','萬',$a);
echo $b;
echo '<h2>加上方括号后替换结果出现乱码</h2><br>';
$c = '天地不仁，以万物为刍狗';
$d = preg_replace('/[万]/','萬',$a);
echo $d;
 ?>

以上程序运行结果可以在http://nyaii.com/s/test.php看到。不知为何，为匹配的中文字符加上方括号后就出现了乱码。同样的情形，在javascript中执行就一切正常。

 '天地不仁'.replace(/[天]/,'')
 //outputs "地不仁"

解决办法：

加上UTF8修饰符即可

$d = preg_replace('/[万]/u','萬',$a);

其余修饰符请见

http://php.net/manual/en/reference.pcre.pattern.modifiers.php

以下为对于题主评论中的问题的补充内容

关于为什么[]内就需要加u修饰符的问题，实际上严格来说，两种场合你最好都加上u修饰符

但为什么[]就会导致乱码呢，这就要从字节层面而不是字符层面来解释了。

首先我们知道PHP的字符串并不是Unicode进行存储的，然后我们来看下这个代码

<?php
$a = "万";
echo strlen($a); //3
for ($i = 0; $i < strlen($a); $i++) {
    echo dechex(ord($a[$i])) . ' '; //e4 b8 87
}

我们可以拿到”万”字的utf8十六进制编码是e4b887

所以在没有开启utf8修饰符的时候，正则表达式引擎并没有把”万”当成一个独立的字符，而是三个字节的连续数据。

以下是结论：

当没有[]进行匹配的时候，它寻找的是十六进制编码值为 e4 b8 87 的三个连续字符，换句话说，实际上你的模式是\xe4\xb8\x87，但这种连续字符的出现在你的字符串中，只有”万”字能对上，所以替换了并不会有乱码。但如果你的字符串里面可能还要包括四字节的utf8编码字符，例如emoji，可能就会导致问题了

当你在万外面包装了[]，正则表达式引擎实际上找的是[\xe4\xb8\x87]，懂正则表达式的很快就能发现它实际上是匹配这三个字符的任意一个，所以这个时候就会影响到除了万以外的别的汉字了

当你加了utf8修饰符之后，”万”会被正则表达式当成是一个独立的字符，所以不再会产生这个问题

至于javascript，因为它对字符编码是原生的unicode，每个字符都会被当成一个字符而不是拆分成字节数据，所以不会产生这个问题

php 正则匹配中文乱码问题
—–文章转载自PHP中文网如有侵权请联系admin#tyuanma.cn删除

在mysql中怎么添加用户名和密码

转载请注明来源：php 正则匹配中文乱码问题_亿码酷站_编程开发技术教程
本文永久链接地址：https://www.ymkuzhan.com/1408.html

下载声明：

本站资源如无特殊说明默认解压密码为www.ymkuzhan.com建议使用WinRAR解压；

本站资源来源于用户分享、互换、购买以及网络收集等渠道，本站不提供任何技术服务及有偿服务，资源仅提供给大家学习研究请勿作它用。

赞助本站仅为维持服务器日常运行并非购买程序及源码费用因此不提供任何技术支持，如果你喜欢该程序，请购买正版!

免责声明：

您好，本站所有资源(包括但不限于：源码、素材、工具、字体、图像、模板等)均为用户分享、互换、购买以及网络收集而来，并未取得原始权利人授权，因此禁止一切商用行为，仅可用于个人研究学习使用。请务必于下载后24小时内彻底删除，一切因下载人使用所引起的法律相关责任，包括但不限于:侵权,索赔,法律责任,刑事责任等相关责任,全部由下载人/使用人,全部承担。以上说明,一经发布视为您已全部阅读，理解、同意以上内容，如对以上内容持有异议，请勿下载，谢谢配合！支持正版，人人有责，如不慎对您的合法权益构成侵犯，请联系我们对相应内容进行删除，谢谢！

php

免费下载或者VIP会员资源能否直接商用？

本站所有资源版权均属于原作者所有，这里所提供资源均只能用于参考学习用，请勿直接商用。若由于商用引起版权纠纷，一切责任均由使用者承担。更多说明请参考 VIP介绍。
提示下载完但解压或打开不了？

最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量，若小于网盘提示的容量则是这个原因。这是浏览器下载的bug，建议用百度网盘软件或迅雷下载。若排除这种情况，可在对应资源底部留言，或联络我们。
找不到素材资源介绍文章里的示例图片？

对于会员专享、整站源码、程序插件、网站模板、网页模版等类型的素材，文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买，且本站不负责(也没有办法)找到出处。同样地一些字体文件也是这种情况，但部分素材会在素材包内有一份字体下载链接清单。
付款后无法显示下载地址或者无法查看内容？

如果您已经成功付款但是网站没有弹出成功提示，请联系站长提供付款信息为您处理
购买该资源后，可以退款吗？

源码素材属于虚拟商品，具有可复制性，可传播性，一旦授予，不接受任何形式的退款、换货要求。请您在购买获取之前确认好是您所需要的资源