这一次,我们为程序员和计算机系大学生编了一本英语词典

2020-08-28 04:08:52 +08:00
 bjzhush

前言:是的,各位没有看错,我们为程序员和计算机系大学生编写了一本程序员专用的词典,叫做 consoleDict (肯搜词典)

缘起:今年 3 月,由于疫情等因素,在家休息的时候,读了一本英文的图书 PDF,内容比较复杂,在读书过程中国有些单词要查询,查的过程中发现有道、金山词霸对非常多编程相关单词存在无结果、各种含义混杂、释义不准确等问题,Google 也能搜到,但是时间较长,打断了读书的状态。 于是转向寻找编程的行业词典,发现并没有合适的词典,但是程序员和编程都是离不开英语的,于是隐约觉得可以搞一个编程相关的词典,准备着手搞搞看。

立项:花了一天多时间,抽取了上百个编程常用单词,在各大词典进行查询并记录结果,发现效果奇差,有兴趣的可以去有道、海词、金山搜下最简单的 git 、vim 、hash 、log 就能有具体的感受了。 于是下决心搞这么一个词典,除了提供最常见的通用释义,对于编程相关的释义,要单独进行标注和释义,要有单词的分布统计,某些单词还要有参考链接,这差不多就是目前 ConsoleDict 的样子,对了,除了网站还需要有个 chrome 扩展,方便在网页上划词直接翻译。

数据:首先要解决的就是通用释义,因为除了编程释义外,通用释义的数据和质量也很重要,在全网下载及购买了几十份各种词典数据后,经过对比选择了其中一份比较全面和质量较好的词典数据,有 300 多 W 单词和短语,通用释义就这样解决了

开发:于是开始了产品的功能设计、页面草图、管理后台、前台页面、用户体系等各项工作,并拉了几个之前的同事来一起开发,一个英语比较好的同事和我负责单词的标注释义及校对。

我们收集了前后端开发、APP 、大数据、Linux 、网络、运维、机器学习、网络安全等十几个分类的几百本英文技术图书,并对内容进行扫描,对所有单词进行词频的统计、清洗、降噪、纠错等工作,收集了几十本非技术 PDF 作为对照,依据词频出现数量等作为排序依据,在学习了大量词典编写相关知识后,对单词进行了尽可能准确的释义、参考链接选取、审核校对等工作。

前后我们花了 3 个多月时间完成了数千个编程词汇的释义工作,这些词汇里面除了编程最常见的单词之外,还包括了非常多的软件名、缩写等,对于能够寻找到权威参考链接的和官网的,我们都将相关链接作为参考链接放入了释义中

除了词汇释义外,我们还开发了网站,包括查询、用户系统、查询历史、浏览器扩展、支付、推广返点等模块,到 8 月底为止,经过反复的测试和核对,在质量满足了我们期望的情况下,在 8 月中旬进行了上线

英语:英语的重要性其实不必赘言,大量英文版图书都没有中译本,互联网上海量的资料只有英文版,代码基本上都是英文单词,可以说英文不好的程序员和英文好的程序员之间的差异,就如同百度和 Google 的差异一样大,衷心希望我们编写的词典,能够在大家开发的道路上为各位助一臂之力!

V2 首发:今天,我们选择了在 V2EX 进行首发,因为 V2 的朋友们,在我们心中是有极客范的,是乐于和敢于尝试新鲜事物的,是行走在互联网的前沿的一群人! 为了答谢 V2 的各位朋友,我们为 V2 的朋友们提供了一个专享的超低的 3 折优惠码 D4CB82 ,在购买页面的优惠码处填入使用,共计 30 次有效使用 ,手快有手慢无哦,欢迎各位使用并提出宝贵建议!

网站地址 https://consoledict.com/

10208 次点击
所在节点    程序员
146 条回复
MeatIndustry
2020-08-28 08:45:44 +08:00
牛逼,顶一个
devwolf
2020-08-28 08:46:44 +08:00
用着优惠码入了 4 年,。。。希望将来词量能更多吧
HENQIGUAI
2020-08-28 08:56:33 +08:00
不发点兑换码的吗,那咋试?
HENQIGUAI
2020-08-28 08:58:43 +08:00
噢,看到了,
devwolf
2020-08-28 09:08:46 +08:00
@learningman 我个人倒是抱着对“输入操作符直接展示可以进行中文搜索的术语界定”(比如输入?.至少能展示一个 js 的可选链,当然我知道这玩意儿 js 是抄来的但起码能知道哪些语言有这个操作符),
或者一些“输错的东西”能引导到正确的关键词(当然这个比较难,但现在仅提供术语方面的中英互转都木大)
这样的期待去看待这类产品的。
目前我倒是也觉得确实意义不大(
hackyuan
2020-08-28 09:11:08 +08:00
面向程序员群体的话要手机登录,一堆人估计扭头就走,建议开放邮箱登录。
bjzhush
2020-08-28 09:24:54 +08:00
@sillydaddy 未付费会员首页有演示单词哈
bjzhush
2020-08-28 09:26:20 +08:00
@devwolf 谢谢,一定努力把产品做的更好!
LokiSharp
2020-08-28 09:31:23 +08:00
看到注册要手机就再见了
sillydaddy
2020-08-28 09:42:36 +08:00
@bjzhush 手机端网页登录好像没有。不过 PC 网页版看到了
xiaotianhu
2020-08-28 09:42:55 +08:00
我比较感兴趣上一次是啥
binbinyouliiii
2020-08-28 09:43:09 +08:00
看间不认识为什么不直接右键 翻译,还要去打开网页输入
ShundL
2020-08-28 09:47:44 +08:00
看上去还不错,注册才能用就只能告辞了,再说这些词汇还不知道什么意思的可以考虑转行,哈哈。
bjzhush
2020-08-28 09:48:39 +08:00
@devwolf 是的哈,后续我们会对所有 404 进行优化的,感谢您的反馈
bjzhush
2020-08-28 09:50:38 +08:00
@ShundL 我们花了几个月的时间翻译了几千个单词,这几个最简单的单词至少拿来举例的哈
TomStark
2020-08-28 09:55:53 +08:00
想用发现要注册
注册发现要购买
甚至不能试用一下吗?
(And 我能不能注销账号)
ShundL
2020-08-28 09:56:24 +08:00
@bjzhush #35 那我觉得不如前期先开放查询,可以限制功能。上来就让注册,估计很多人就放弃了。
RockShake
2020-08-28 09:59:15 +08:00
可能对学生有用吧
luckykelan
2020-08-28 10:03:28 +08:00
已充值购买一年会员,但是第一个单词确实有点劝退了
inflate 这个单词,在词典上很容易就可以查明膨胀、充气的释义
但是既然定位了程序员词典,是否应该提供更符合编程情景下的释义
aeli
2020-08-28 10:04:12 +08:00
就这么一点核心服务(还大概率不如收费的专业词典更准确),这个服务模式感觉选错了。

我觉得要么免费走广告,要么直接卖卖电子书词典还靠谱点。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/702066

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX