为什么 Google 搜不到 ♫ 这样的 Unicode 特殊符号? 👿🐶👻🎅🐡

2015-05-24 11:22:58 +08:00
 Luzifer


©

®

---



百度可以




http://www.unicode.org/charts/PDF/U1F300.pdf

3424 次点击
所在节点    问与答
9 条回复
wy315700
2015-05-24 12:14:52 +08:00
谷歌好像搜索的时候基本上都是去掉符号的。。
ynyounuo
2015-05-24 12:34:28 +08:00
https://support.google.com/websearch/answer/2466433



至于原因,我只想得到原来屏蔽「@」是为了防止邮箱 Spam,现在因为有了 tag 这种东西又可以搜索了。其余的就不清楚了。
ynyounuo
2015-05-24 12:46:13 +08:00
供参考:

▋Emoji
<amp-youtube data-videoid="OPKFSvAr5yY" layout="responsive" width="480" height="270"></amp-youtube>&feature=youtu.be&t=3090
51:31 开始谈到了 Emoji 不显示在 Google 搜索结果里的大概原因

▋Symbol
https://www.seroundtable.com/archives/000022.html
03 年已经屏蔽了大部分的符号
Luzifer
2015-05-24 13:38:41 +08:00
@ynyounuo 多谢,辛苦了。❺❷❶

03 年就过滤了很多字符 。。٩๏̯͡๏۶。 。15年还有人在问。。٩๏̯͡๏۶

Emoji 出现在搜索结果里影响用户体验。ൠ

There is a lot of crap represented by Unicode
15ir
2015-05-24 17:34:24 +08:00
记得bing可以
Luzifer
2015-05-24 18:57:19 +08:00
@15ir 谢~

BING 也搜不到符号。







解释了符号,不错呃。
billgreen1
2015-05-24 20:19:27 +08:00
很多教授的主页里面是含有波浪号的(~),我曾经十分想搜索这类信息
Jinping
2015-05-25 07:51:59 +08:00
http://qr.ae/fENiJ 大概意思是这些符号的信息熵很低,但处理它们消耗的资源太高,所以直接从query里给strip了
Luzifer
2015-05-25 11:30:08 +08:00
@Jinping

昨天在引申问题 http://www.quora.com/A-Google-search-for-does-not-turn-up-any-results.-Does-Google-not-index-these-characters 里看到

Google doesn't index many characters because it would increase the amount of data they have to store to help a very small percentage of queries.

原来这句话就是 信息熵低

多谢,又学习到了。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/193321

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX