诡异的 Chrome 编码问题…?是我见识短吗…

2017-01-21 12:56:33 +08:00
 wdhwg001

最近遇到了一个头大的编码问题,出现在 Chrome 改变页面编码至非 UTF8 的时候。

当前的 Chrome 已经不支持随便改页面编码了,所以要么安装插件,要么需要在本地调试,把编码设定到非 UTF8 ,比如 GB18030 。

var foo=new Image();
foo.src = 'https://mdn.mozillademos.org/files/7693/catfront.png 你';
console.log(foo.src);

以上这段返回的结果是https://mdn.mozillademos.org/files/7693/catfront.png%20%E4%BD%A0

…嗯,非常正常。

var foo=new Image();
foo.src = 'https://mdn.mozillademos.org/files/7693/catfront.png?你';
console.log(foo.src);

…返回的结果是https://mdn.mozillademos.org/files/7693/catfront.png?%C4%E3

…只多了一个问号,编码和之前完全不同了,变成了 GB18030 编码…

所以这是什么状况… Chrome 的 Bug 还是有标准要求这样处理?

有些不能理解,顺便 IE 是不会对这个字符串做 escape 的,实际提交了怎样的请求还有待观察…

3129 次点击
所在节点    JavaScript
6 条回复
wdhwg001
2017-01-21 13:11:18 +08:00
Edge 对不问号的反应是`https://mdn.mozillademos.org///files/7693/catfront.png?ä½ 
https://mdn.mozillademos.org//files/7693/catfront.png%20ä½%C2%A0`

对带问号的反应是`https://mdn.mozillademos.org///files/7693/catfront.png?ä½ `

有些莫名其妙了…其中“ä½ ”用 escape()转码后刚好是%E4%BD%A0 …
wdhwg001
2017-01-21 13:13:48 +08:00
被 V2EX 的自动处理坑了一波, Edge 对不带问号的反应是`%20ä½%C2%A0`…%C2 出现的莫名其妙。
flyingghost
2017-01-22 11:37:23 +08:00
1 ,网站如果使用 UTF8 的话,第二段代码也会使用 UTF-8 。
2 ,网站如果使用 GBK 的话, url 部分依然是 UTF-8 (???), query 部分会被编码为 GBK 。
3 , chrome/firefox 表现一致。

问号部分和我预期不符啊。。。等高人解释问号部分。。。
p2227
2017-01-22 18:07:25 +08:00
把编码设定到非 UTF8
是指 HTML 文件包含 `<meta name="Content-Type" content="text/html;charset=gbk">`还是说文件的实际存储代码是 gbk ?
wdhwg001
2017-01-22 19:49:05 +08:00
@p2227 二者均有。事实上单纯在浏览器中改变编码并使用控制台测试也可以触发这个问题。
wdhwg001
2017-01-22 19:52:21 +08:00
简单翻了一下 URI 的 RFC ,似乎没有提到“ query 的编码由当前页面决定, path 统一编码为 UTF-8 ”这样的描述。
不过也许是我看的不仔细,或者这件事是由 w3c 一类的规定的…?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/336039

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX