关于 mb_convert_encoding 的转码问题

2015-12-30 19:56:23 +08:00
 ben548

代码如下:
echo mb_convert_encoding('小春子', 'UTF-8', 'GB18030');
echo mb_convert_encoding('灏忔槬瀛', 'GB18030', 'UTF-8');

此时运行时看到:
灏忔槬瀛小春��

问题是:为什么小春子没有正常显示而是出现了乱码呢?
注:文件编码和浏览器编码都是 utf-8

3776 次点击
所在节点    PHP
5 条回复
lynnworld
2015-12-30 20:29:43 +08:00
那`echo mb_convert_encoding(mb_convert_encoding('小春子', 'UTF-8', 'GB18030'), 'GB18030', 'UTF-8');` 是啥?乱码输出不一定是全部的内容。
ben548
2015-12-31 10:21:18 +08:00
@lynnworld 试了下,结果如下:
echo mb_convert_encoding('小春子', 'UTF-8', 'GB18030');
echo mb_convert_encoding('灏忔槬瀛', 'GB18030', 'UTF-8');
echo mb_convert_encoding(mb_convert_encoding('小春子', 'UTF-8', 'GB18030'), 'GB18030', 'UTF-8');

运行结果是:
灏忔槬瀛小春��小春��

真是太奇怪了
pine
2016-01-05 09:02:25 +08:00
小春子!=灏忔槬瀛,你的编码用的 utf8 ,一个字 3 个字节 3*3=9 , gb2312 ,一个字 2 个字节,所以小春子变成灏忔槬瀛的时候,还有一个字节没法正常显示被 php 忽略掉,在转为 utf8 的时候,只能显示两个字,另外两个字节无法正常显示,所以浏览器显示为��。
还有就是 mb_convert_encoding 的用法不是你这么用的吧??
ben548
2016-01-05 14:02:36 +08:00
@pine 哦,总算是理解了,你说 mb_convert_encoding 不是这么用的是什么意思啊?
pine
2016-01-07 15:33:20 +08:00
比如, mb_convert_encoding('小春子', 'UTF-8', 'GB18030');这个函数是把 gb18030 转成 utf8 的,而不是相反,这个和 iconv 不一样。其次,转码是因为有两个编码环境才需要转码,你这里只有 utf8 ,没见到用 gb18030 的环境啊

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/247275

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX