1、问题重现
$item = '3×魔力之源、300×10钻石、300000×金币、';
var_dump( rtrim('、', $item) );
string '3×魔力之源、300×10钻石、300000×金��' (length=47)
2、原因
rtrim函数把参数都转成了UTF8后再进行比较。
对于中文,一般都是先转成Unicode,再根据下表转成UTF8。
UCS-4(UNICODE)编码 UTF-8字节流
U-00000000 – U-0000007F 0xxxxxxx
U-00000080 – U-000007FF 110xxxxx 10xxxxxx
U-00000800 – U-0000FFFF 1110xxxx 10xxxxxx 10xxxxxx
U-00010000 – U-001FFFFF 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
U-00200000 – U-03FFFFFF 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
U-04000000 – U-7FFFFFFF 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
“币”的Unicode为\u5e01,转成二进制101111000000001,转成UTF8为11100101 10111000 10000001;
“、”的Unicode为\u3001,转成二进制 11000000000001,转成UTF8为11100011 10000000 10000001;
rtrim是一个一个字节过滤的,可见“币”的UTF8最后变成了11100101 10111000,导致出现了乱码。
3、解决方法
var_dump(mb_substr($item,0,-1,'utf-8'));
string '3×魔力之源、300×10钻石、300000×金币'
————————————————
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
原文链接:https://blog.csdn.net/balmunc/article/details/51510086
在工作中遇到一个情况是,想把一个字符串分割成数组,字符串是这样的:
$a="腹泻;恶心;头痛;";
分割数组的代码是这样的:
$b=explode(';',rtrim($a,';'));
结果,打印出来的$b是这样的:
Array
(
[0] => 腹泻
[1] => 恶心
[2] => 头��
)
查明原因后,才知道,rtrim函数把参数都转成了UTF8后再进行比较,对于中文,一般都是先转成Unicode,再根据下表转成UTF8。
解决方法:
1.mb_substr($a,0,-1,'utf-8')
2.array_filter(explode(';',$a))