Dogedoge 中文搜索发布月余,目前搜索总量突破 100 万次。小结一下过去,也跟大家说说心中未来...[约 1200 字]

2019-07-22 20:00:12 +08:00
 nicoljiang

一些数字

前情介绍

38 天前,我在 V 站正式发布了 Dogedoge 搜索,初衷希望能让大家在百度之余和翻墙不便的情况下,有一个不错的备选( https://www.v2ex.com/t/573950 ),是 V 站当时较热的帖子之一。

Dogedoge 不仅得到了很多人的支持,还得到了大佬的推荐(一度造成宕机)。使用的数量超出了预期,于是紧急做了很多本来佛系排期的事情,以应付可能发生的突然问题:

  1. 内容安全;
  2. 网络攻击;
  3. 搜索结果面太窄;

大家看起来跟发布时并没有两样,的确是所有的新特性开发都暂停了,因为安全问题超出了我的预期(出现许多我做梦都想不到的敏感词)。

小结一下这 30 几天里发生的事情:

  1. 被十余个自媒体&知乎(超级感谢🙏)推荐,其中动静最大的要属「阮一峰」在微博推荐: https://www.weibo.com/1400854834/HzjTGsNEM
  2. 经历了 8 次规模较大的 CC 攻击;
  3. 做了三次扩容(第一次是为了应付 阮一峰 推荐带来的流量暴增);
  4. 做了 12 次搜索结果优化;
  5. 做了 51 次搜索结果敏感内容处理(影响精力的最大头);
  6. 搭建流量统计系统(为了避免第三方 Cookies 的采集,没用任何第三方统计)。

关于未来

。壹

如大家所见,前端依旧使用 duckduckgo.com 的皮,Logo 也非常缺乏诚意。所以第一件事恐怕是要开始启动一些改版计划,但应该会慢慢来,习惯的延续很重要。是以,若有美术功底、前端技术很棒的同学对 Dogedoge 有兴趣的,欢迎联系我: nicol@soft.org ,我们可以探讨如何合作,或者仅仅是天马行空的想法;

。贰

  1. 通过 3 次扩容后,系统也已经能扛住一定的突发请求了。是以,在这里想恳请喜欢 Dogedoge 的同学,在自己的广播站中为 Dogedoge 推荐一波。博客、论坛、朋友圈、微博 都可以,不需要专门赞美,希望能说一些客观想法。发了微博的同学可以把链接跟到帖子里,无论是有 1 个人看,还是 100 个人看,Dogedoge 都会铭记于心。虽然眼下还难以做出实质性的回报,但已经有了一些相关的想法,下面会阐述;

  2. 通过 10 余次搜索结果优化,目前搜索结果在大部分情况下已经比较丰富合理了。所以对于有网址导航产品的同学( V 站居民应该人手一个吧),Dogedoge 也恳请大家可以领养一波 —— 把 https://www.dogedoge.com/results?q=%s 加入到搜索框中的引擎选项中:

    1. 名称为「多吉搜索」或「 Dogedoge 搜索」均可,Logo: https://www.dogedoge.com/assets/logo_header.v108.svg
    2. 若 7 日平均每天搜索量平均能高于 1,000,可以联系我定制结果页的 Logo
    3. 若 7 日平均每天搜索量能高于 10,000,则可以联系我定制结果页的 Logo、名称、子域名

。叁

Dogedoge 要成为真正实用的搜索引擎,势必要支持很多的即时结果( Instant Result )。目前仅仅支持 IP 查询、货币兑换查询。其实非常重要的还有:天气、万年历(假日)、各种微型工具。但一个人的精力着实非常有限,所以想集思广益,谁有很实用、美观的 JS 程序,欢迎跟我探讨接入,Dogedoge 会在工具旁加上你的主链接。前端达人们若有其他更好的方案,也可以在回帖中或通过 nicol@soft.org 与我讨论。

。肆

  1. 在年底之前,希望能搞定「网盘搜索、图片搜索、视频搜索、资讯搜索」等几个重要的板块;
  2. 希望能启动新的「中文 Wiki 计划」。

。伍

因为已经备案了,所以排查敏感内容必然也是长久的重中之重。Dogedoge 会自觉维护祖国的完整和声誉,希望做一个遵纪守法的搜索工具,以能够长久、稳定地为大家服务(若有漏网之鱼,还请大家千万告知)。

关于收入

有很多人朋友特别担心会坚持不下去。其实想想目前成本着实不低,所以是迟早需要开拓一些收入的。目前有三个想法,请大家来讨论和把关一下:

  1. 部分商品的搜索结果,接入一些电商的联盟 —— 即「当用户搜索一些与商品相关的关键词时,通过商品的返利链接获得一些手」。如:搜索一些技术关键词时,右侧可以显示 3-6 个相关书籍的链接;
  2. 实现一些增值功能(但还没想好有一些什么样的增值功能);
  3. 针对开发者和小团队,推出更多更丰富更实惠的接口,例如:定制化的云搜索;
  4. 向广大用户乞讨(捐赠),以「资助者列表」的形式,在固定页面为大家的博客或产品放置一个带 icon 的链接;
  5. 还有别的好建议,欢迎回帖讨论。
6032 次点击
所在节点    奇思妙想
105 条回复
noob1445
2019-07-22 20:07:21 +08:00
原来开发者就在 v 站,dalao
Buges
2019-07-22 21:01:41 +08:00
我来泼冷水了:你这玩意就别想“合法”的做下去。
Google 当初退出中国可从来不是因为审查。
“遵纪守法”完全就和一个搜索引擎,一个高效聚合索引信息的工具水火不容。
这里的“合法”指的是“合规”,因为某国不是法制国家,也根本没有明确的法律条文告诉你什么能有,什么不能有。上面只会含含糊糊的一通电话,一个通知,让你自己“揣摩圣意”,根本没有明确的界限。这些内容太多又太含糊,你需要耗费大量精力也一定有漏网并且这个“度”还要你自己把握。
当然了,你也可以屏蔽 gfwlist 的地址,甚至只索引 cn 的站点。这样一来,搜个剧 YouTube 本来该在置顶你没有,搜技术关键词没 wiki,如此种种,这算哪门子“实用的搜索引擎”?还不如去了广告的 baidu。
至于「中文 wiki 计划」我不知道你指的什么,如果是类 Wikip.edia 那样的,那肯定不可能。因为 wiki 的核心理念,客观,中立,自由,在这里是“不合法”的。
rogwan
2019-07-22 21:03:31 +08:00
干脆搞成付费搜索,每年 120 元这样的会员制,提供快照访问(快照更新要及时),专注提高搜索质量。如果搜索质量国内普遍比百度高,大约要多少会员量能覆盖住成本?
yueye
2019-07-22 21:09:56 +08:00
Personal Blocklist 和自定义搜索服务可以考虑成增值功能?

搜索结果会增加按照时间排序的选项吗?
nicoljiang
2019-07-22 21:53:26 +08:00
@rogwan
个人的 Blocklist 可以考虑的。按时间排序对于通用搜索的部分,短期内还做不太到(如果是资讯服务,这块儿上线之后是 OK 的);
至于自定义搜索服务,你说的是可以索引自己文档的搜索么?这个我确实打算开放(就是云搜索服务);

@rogwan
每年 120 元的会员费,假设完全没有免费搜索,那么 3000 位左右的付费用户大概可以收支平衡(这部分用户应该是相对重度的用户),但这么高频的基础服务,其实是没法做严格的收费服务的(会损失基础便捷性,大量的搜索数据本身也是优化搜索结果的重要依据);那么假如同时提供哪怕最基础的用户,双方哪怕能到 1:9,那直接就是 10 倍啦(因为对收费的用户还需要提供更多的增值服务);所以,收费的用户可以没有广告,但对于免费的部分,依然要有其他的营收方式。

@Buges 从「法」的定义上,很惭愧,目前的确还是立足于中国,即便是某个条款也得遵守。对于 wikip 这种,其实是有一些方法的(目前在筹备); YouTube 也可以做到,但可能需要收费维持(当然我说的并不是简单的 VPN 或代理的方案)。不过非常非常感谢你的警醒。
sunny2580839896
2019-07-22 22:02:39 +08:00
从发布我就关注了,反正我一直在用,手机电脑也在使用,但是频率不是太高
Counter
2019-07-22 22:12:04 +08:00
谢谢作者,你的作品很好用,希望走得长远
yincheng
2019-07-22 22:22:21 +08:00
DuckDuckGo 有一个叹号搜索我觉得思路不错,不过他家做的感觉略微有点复杂。借鉴一下做成功能拓展应该不错。
dezhou
2019-07-22 22:41:25 +08:00
给个建议,单纯的出于好奇是做不久的,看你的发展路线图,不如好好专研技术而不是做大而全的搜索,毕竟是个个人维护的,从技术角度出发反而可以做成一个有趣的事情。
koodai
2019-07-22 22:56:52 +08:00
翻看了一下原帖,天哪!交口称赞,楼主了不起,搜索试了一下,确实很出色。已替换默认搜索引擎,希望项目能长期健康发展。
Exia
2019-07-22 23:33:54 +08:00
自从楼主推荐了这个搜索,我就一直用了,挺好的,支持一下
Yourshell
2019-07-23 00:08:57 +08:00
先天太监与后天太监🐒,不过狙击老太监百度我还是支持的😄
gzdaijie
2019-07-23 00:24:45 +08:00
支持楼主!
well666
2019-07-23 00:45:20 +08:00
对了,我刚才试了一下,有些结果虽然做了过滤,可是内容看起来还是挺讽刺的。
香港💪还能搜到结果,虽然没什么特别敏感的,但是提到审查了。最近发生了那啥都懂的。hk01 还索引了真是...lz 专注非政治内容的话这些新闻媒体基本都是无关的,对于这个网站的目标人群来说也大都上不了,用 Google+duckduckgo+各种 news 基本上都能知道了,可以默认降权。或者参考后续那样的时间流,虽然来源换汤不换药但是好歹引用+时间线也算是尽力了(最喜欢看打脸,魔幻)。
v2 都出国了.
你这是铤而走险啊,希望能有个好结果吧。
rogwan
2019-07-23 00:46:54 +08:00
@nicoljiang 如果只需要 3k 用户就能盈亏平衡,完全可以众筹一下开始啊。某度的搜索质量实在无法忍受了,基本都是 bing 和谷歌才能找到有效的结果,确实想要一个纯粹的搜索服务,我是愿意付这个会员费的。
guiqiqi
2019-07-23 00:48:09 +08:00
支持大佬,下次在我的小破站里给大佬也做做宣传^_^
AngryPanda
2019-07-23 01:26:31 +08:00
按照我的经验,要不了多久域名就会停止解析。
xusp
2019-07-23 02:00:28 +08:00
nicoljiang
2019-07-23 02:16:20 +08:00
@well666 多谢多谢,刚刚已经处理了一波。
@rogwan 你提的这个方向确实是点醒到我。但如果完全收费(登录后才可搜索),我倒不是担心付费用户够不够,而是搜索这一随时可能急用的功能本身的基础体验就会降低(试想万一随手想搜个东西还得登录一波,然后可能长期在桌面端记录的密码忽然不记得了)。所以上面帖子里我也说了,可能觉得最平衡的是:付费有部分增值服务+免广告,免费搜索的时候会有部分广告(例如:支持者名单)
@dezhou 能否详细说一下,技术角度出发是怎么个思路?
@yincheng 嗯,这个确实是值得参考,但 IR 也还是要做的(出发点不太一样)。
@sunny2580839896 @Counter @gzdaijie @koodai 希望不辜负你们的喜爱,谢谢。
@Yourshell 我觉得百度目前最大的问题不在于阉割敏感结果(毕竟大家都要活着才能提供服务嘛),主要的问题是搜索结果太不客观(百家号、贴吧、知道 等内容的权重远远高于他们应得的)
@guiqiqi 谢谢你小老弟。
nicoljiang
2019-07-23 02:17:02 +08:00
@AngryPanda 你说的我都快哭了...

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/585195

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX