V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
bjzhush
V2EX  ›  程序员

这一次,我们为程序员和计算机系大学生编了一本英语词典

  •  1
     
  •   bjzhush · 2020-08-28 04:08:52 +08:00 · 8044 次点击
    这是一个创建于 418 天前的主题,其中的信息可能已经有所发展或是发生改变。

    前言:是的,各位没有看错,我们为程序员和计算机系大学生编写了一本程序员专用的词典,叫做 consoleDict (肯搜词典)

    缘起:今年 3 月,由于疫情等因素,在家休息的时候,读了一本英文的图书 PDF,内容比较复杂,在读书过程中国有些单词要查询,查的过程中发现有道、金山词霸对非常多编程相关单词存在无结果、各种含义混杂、释义不准确等问题,Google 也能搜到,但是时间较长,打断了读书的状态。 于是转向寻找编程的行业词典,发现并没有合适的词典,但是程序员和编程都是离不开英语的,于是隐约觉得可以搞一个编程相关的词典,准备着手搞搞看。

    立项:花了一天多时间,抽取了上百个编程常用单词,在各大词典进行查询并记录结果,发现效果奇差,有兴趣的可以去有道、海词、金山搜下最简单的 git 、vim 、hash 、log 就能有具体的感受了。 于是下决心搞这么一个词典,除了提供最常见的通用释义,对于编程相关的释义,要单独进行标注和释义,要有单词的分布统计,某些单词还要有参考链接,这差不多就是目前 ConsoleDict 的样子,对了,除了网站还需要有个 chrome 扩展,方便在网页上划词直接翻译。

    数据:首先要解决的就是通用释义,因为除了编程释义外,通用释义的数据和质量也很重要,在全网下载及购买了几十份各种词典数据后,经过对比选择了其中一份比较全面和质量较好的词典数据,有 300 多 W 单词和短语,通用释义就这样解决了

    开发:于是开始了产品的功能设计、页面草图、管理后台、前台页面、用户体系等各项工作,并拉了几个之前的同事来一起开发,一个英语比较好的同事和我负责单词的标注释义及校对。

    我们收集了前后端开发、APP 、大数据、Linux 、网络、运维、机器学习、网络安全等十几个分类的几百本英文技术图书,并对内容进行扫描,对所有单词进行词频的统计、清洗、降噪、纠错等工作,收集了几十本非技术 PDF 作为对照,依据词频出现数量等作为排序依据,在学习了大量词典编写相关知识后,对单词进行了尽可能准确的释义、参考链接选取、审核校对等工作。

    前后我们花了 3 个多月时间完成了数千个编程词汇的释义工作,这些词汇里面除了编程最常见的单词之外,还包括了非常多的软件名、缩写等,对于能够寻找到权威参考链接的和官网的,我们都将相关链接作为参考链接放入了释义中

    除了词汇释义外,我们还开发了网站,包括查询、用户系统、查询历史、浏览器扩展、支付、推广返点等模块,到 8 月底为止,经过反复的测试和核对,在质量满足了我们期望的情况下,在 8 月中旬进行了上线

    英语:英语的重要性其实不必赘言,大量英文版图书都没有中译本,互联网上海量的资料只有英文版,代码基本上都是英文单词,可以说英文不好的程序员和英文好的程序员之间的差异,就如同百度和 Google 的差异一样大,衷心希望我们编写的词典,能够在大家开发的道路上为各位助一臂之力!

    V2 首发:今天,我们选择了在 V2EX 进行首发,因为 V2 的朋友们,在我们心中是有极客范的,是乐于和敢于尝试新鲜事物的,是行走在互联网的前沿的一群人! 为了答谢 V2 的各位朋友,我们为 V2 的朋友们提供了一个专享的超低的 3 折优惠码 D4CB82 ,在购买页面的优惠码处填入使用,共计 30 次有效使用 ,手快有手慢无哦,欢迎各位使用并提出宝贵建议!

    网站地址 https://consoledict.com/

    第 1 条附言  ·  2020-08-28 09:45:23 +08:00
    统一回复一下某些问题和批评哈
    关于邮件及手机登录:开始主要是考虑到国内的邮箱环境比较乱,会有邮件进垃圾箱、收不到等种种情况,手机短信只需要一个短信接口就好,这样服务比较稳定,后续我们会考虑支持邮箱登录的

    关于体验:注册前和注册后,首页都是有演示单词可以点击直接查看效果的哈

    关于 Google 也能搜到单词甚至有朋友贴了 40 年前的词典图片来质疑:第一我们的功能和使用场景是跟通用词典不同的,我们除了提供通用释义,还提供应对编程的编程释义,这是市面上没有的,不管是 Google 搜索还是翻译,其实翻译的结果也是有很多问题的,这里面展开了说能写上万字长文,恕我只能点到为止,Google 搜索会造成阅读状态中断,而 Google 翻译主要面对的是文本翻译,定位也不是词典,有大量的软件名、缩写 Google 也是没有的,举个简单的例子 ELK,您可以去看看

    此外感谢购买的各位,感谢您的支持,我们一定会努力,这几千个单词,我们花了几个月时间翻译校对,我们不奢求每个人认同,更不奢求所有人成为用户,但是还请不要攻击我们,就跟郭德纲相声似的,您觉得好听就买张票,觉得不怎么样,也就哈哈一乐,不要指着鼻子骂街,好吗?
    第 2 条附言  ·  2020-08-28 10:21:24 +08:00
    感谢各位的支持与建议!

    尽管我们自己进行了各种测试,但是还是发现用户才是最好的测试!

    也发现了个别单词查不到的情况,我们一直都在全力关注和改进

    毕竟是一个新产品,人无完人,产品也没有一上线就十全十美的

    为了感谢付费用户的支持,以及弥补前期我们产品的小问题的影响,我们决定,凡是在 2020 年 8 月和 9 月购买了的用户,作为我们的首发用户也是首批用户,我们将会再额外赠送购买时间的 50%,购买 24 小时内,赠送时长自动到账

    再次感谢!
    第 3 条附言  ·  2020-08-29 15:29:04 +08:00

    没有想到这个帖子引起了这么多的讨论,有鼓励也有批评,每一条我们都仔细看了,感谢提出建议和鼓励的朋友。

    在这里最后回复一次,之后这个帖子不再回复。

    关于Google也能搜到单词的结果

    每个产品对应的场景都不同,Google归根结底是搜索引擎,不是词典,如果按照这个逻辑,那么有道和金山也没有存在的价值了,何况Google搜一个单词,出来的是一堆页面,即使有翻译,一般也只有一个词,阅读时候,真有人不嫌麻烦每个词都去Google?用我们的浏览器扩展划词选中就可以弹窗出结果不方便? 如果把查词比喻成吃饭,那么可能Google是大饭店,有道金山是一般的馆子,而我们就是711、全时这种便利店,场景不同,每个人都有下馆子的需求,同样每个人也都会有在便利店买个饭团当饭吃的时候

    关于付费

    付费是我们设置的,也是用户可以自由选择的,觉得对自己有用的可以买,觉得不适合自己的我们也没逼着谁买,正如郭德纲所说,你不听相声没人逼着你听,可你天天跑到说相声的门口骂街,那可就有点那什么了。 说免费公开的,服务器的费用谁出呢?一月就算200不多吧,一年2400麻烦先给转过来吧 说句不好听的,键盘侠当起来挺过瘾的,可是有几个人做过免费的东西然后自己花钱拿出去给别人用提供服务呢?

    关于价格和赠送购买的一半时长

    算上我们承诺并且已经兑现了凡是9月底之前在V2购买的朋友都赠送一半的订单时长,3种套餐平均每月最低也就1.6元,最高也就2元一月,这在以后别的任何渠道都不会有这么低的价格,但是既然我们承诺了,我们就会兑现。

    此贴不再回复

    每一个产品都不可能让所有人都满意,这是很正常的,如同郭德纲所说再好的艺术形式也不可能所有人都喜欢,微信支付宝算是垄断了吧,可是一样有人不喜欢不用。 感谢很多朋友的收藏乃至感谢,我们诚惶诚恐,感谢很多朋友的建议,我们每一条都会认真去听去改进,也想对少数把我们批得一无是处的朋友说,我们会坚持我们的选择。 打嘴仗是没有意义的,所以,从今天(2020年8月29日)开始,这一贴我们不会再看,更不会再有回复,我们会持续去改进优化我们的产品和质量。

    山高水长,江湖再会!

    144 条回复    2020-09-18 16:11:52 +08:00
    1  2  
    duxiansen
        101
    duxiansen   2020-08-28 17:24:31 +08:00
    "二、SHELL 这个词在您下午查询之前确实没有标注,这是因为我们采用了比较复杂的词频统计来决定我们标注单词的顺序,但是我们发现一个补一个,今天已经补了二十多个单词的释义了"

    好奇你说的翻译了几千个单词,到底是几千。shell 算是常见的了吧,刚随便搜了个计算机常用词汇表,1500 词的都能找到。等在这里搜不到再去用搜索引擎的时候,不知道多浪费了多少倍的时间。
    而且今天还能补二十多个,感觉早期付费用户就是在帮你们改善词库
    bjzhush
        102
    bjzhush   2020-08-28 17:32:04 +08:00
    @duxiansen 目前标注了的是 5000 多单词,请不要以某个单词作为整个产品的判断依据
    Kvip
        103
    Kvip   2020-08-28 17:32:49 +08:00
    额,手机验证码发了收不到。。。
    yeyang5211
        104
    yeyang5211   2020-08-28 17:33:16 +08:00
    老铁先别收费啊.. 用户习惯都没培养起来 谁给你付费, 先免费个几年积攒一些口碑再说
    yeyang5211
        105
    yeyang5211   2020-08-28 17:33:53 +08:00
    需要注册这点就把我拦住了, 谁去翻译或者搜索的时候还注册了 嫌麻烦
    bjzhush
        106
    bjzhush   2020-08-28 17:34:12 +08:00
    @Kvip 请问有什么具体的报错吗
    tikazyq
        107
    tikazyq   2020-08-28 17:36:25 +08:00
    要注册,放弃
    Hades300
        108
    Hades300   2020-08-28 17:39:15 +08:00
    这种工作量... 好奇问问团队多少人?
    simpleapples
        109
    simpleapples   2020-08-28 17:42:26 +08:00
    @bjzhush 建议给获取短信验证码按钮加上图片验证
    Hilong
        110
    Hilong   2020-08-28 17:43:35 +08:00 via iPhone
    给你们一个建议,可以和相关的背单词软件合作,我在百词斩和扇贝单词上还是挺想有一个这样的词典来学习的。查询本身就是低频,我觉得直接卖单词书更好操作
    bjzhush
        111
    bjzhush   2020-08-28 17:44:17 +08:00
    @simpleapples 谢谢提醒,今天上线第一天就被攻击流量和短信,有坏人啊!
    py2ex
        112
    py2ex   2020-08-28 17:50:15 +08:00
    @Livid 这是一个推广贴。可能应该去推广节点 /promotions

    参见正文:“V2 首发:今天,我们选择了在 V2EX 进行首发,因为 V2 的朋友们,在我们心中是有极客范的,是乐于和敢于尝试新鲜事物的,是行走在互联网的前沿的一群人! 为了答谢 V2 的各位朋友,我们为 V2 的朋友们提供了一个专享的超低的 3 折优惠码 D4CB82,在购买页面的优惠码处填入使用,共计 30 次有效使用 ,手快有手慢无哦,欢迎各位使用并提出宝贵建议!”
    HFX3389
        113
    HFX3389   2020-08-28 17:52:00 +08:00
    @bjzhush #111 在 V2 发网站,不管是哪种,甚至是博客也好,都会经历一段 DDOS 的,都已经成为一个 DDOS
    DDOS 试验地了!已经见怪不怪了!
    dingyaguang117
        114
    dingyaguang117   2020-08-28 17:52:04 +08:00
    居然要登录。。。
    HFX3389
        115
    HFX3389   2020-08-28 17:53:33 +08:00
    @tikazyq #107
    @dingyaguang117 #114
    不仅要注册和登录,还要付费
    huage2580
        116
    huage2580   2020-08-28 18:10:18 +08:00
    差评,注册登录+付费。我建议广大 V 友拿出一个免费的,即用即走的。
    mornlight
        117
    mornlight   2020-08-28 18:11:38 +08:00
    可以考虑额外提供微信和邮箱登录,提供手机号会挡掉相当多的人,查单词功能显然没有验证手机号的必要。验证邮件也有专门的邮件发送服务,比短信便宜多了。
    bjzhush
        118
    bjzhush   2020-08-28 18:12:22 +08:00
    @huage2580 我们付出了心血标注单词,大家觉得合适就付费,不合适就不买,为什么要标榜免费??
    bjzhush
        119
    bjzhush   2020-08-28 18:12:50 +08:00
    @mornlight 能推荐个发邮件的服务吗?
    masker
        120
    masker   2020-08-28 18:15:11 +08:00 via Android
    @bjzhush 引用#48 楼的, “shell 算是常见的了吧,刚随便搜了个计算机常用词汇表,1500 词的都能找到。”
    这叫付出了心血?
    bjzhush
        121
    bjzhush   2020-08-28 18:16:32 +08:00
    @masker 不想抬杠,这个词我们没有标注到,但是也不用看到个麻子就说人家有麻疹吧!
    mornlight
        122
    mornlight   2020-08-28 18:19:30 +08:00   ❤️ 1
    @bjzhush #119 目测你服务器用的阿里云,阿里云就有 https://www.aliyun.com/product/directmail
    masker
        123
    masker   2020-08-28 18:21:01 +08:00 via Android
    @bjzhush shell 这么常见的都没有,说啥付出心血呢。
    deecyn
        124
    deecyn   2020-08-28 18:33:07 +08:00
    打开网站准备查词 --> 发现需要注册登录才能查?--> 搜索框谷歌搜索 --> Get.
    liuzhazha
        125
    liuzhazha   2020-08-28 18:52:45 +08:00
    看的出楼主做的很用心,功能完成度挺高的,个人建议每天有几次的试用额度,超出额度再提示升级
    futou
        126
    futou   2020-08-28 19:07:19 +08:00   ❤️ 1
    你们的目标用户太尴尬了,专业相关的不用查,专业不相关的更不会去查...
    总共耗时三个月,翻译了几千个词汇,然后就推出注册+无试用的按年收费制度,又看了示例词汇,最起码你们的当前的工作量实在是对不起你们的收费。
    Heanes
        127
    Heanes   2020-08-28 19:08:00 +08:00
    创意不错,就是要注册才能用,会赶走一大批人
    bjzhush
        128
    bjzhush   2020-08-28 19:11:52 +08:00
    @liuzhazha 谢谢,会考虑的

    @futou 很多人英语都很差,中国人的英语,能有几个掌握大部分专业词汇?
    IllBeBack
        129
    IllBeBack   2020-08-28 20:05:41 +08:00
    如果你真是程序员,还是要把 if else 用起来,不要舍不得。如果这个词“暂无编程释义”,那就不要加上“充值 VIP”的提示。

    不是所有的付出都应该有回报,你挖三个月地,和淘三个月金,虽然付出差不多,但最终结果是完全不一样的,首先要选对地方。

    其实服务器能用几块钱?主要是人工吧。这个最好当 side project, 不要急着赚钱,先靠初期用户把他们查的单词做好,他今天查的,没有查到,你明天给他发个邮件说我编辑好了,过来看看。这也会让他们觉得花钱很值。不然每天查词都是查不到的挫败感。

    如果你这么看重盈利,我就替那些已经付费的担心了,你们离收支平衡还有很大的距离。如果不算人工,那还不算难。
    no1xsyzy
        130
    no1xsyzy   2020-08-28 20:20:26 +08:00
    @bjzhush 分条回复请对齐原序数,你不想回复的和认为没必要回复的可以跳过该序数。
    1 、我是指,明明必须登录,在没登录的情况下首页应当跳转到登录界面。
    输入单词——提示未登录——( 6 秒)——跳转登录界面——(可能注册)——(不确定是否需要再次输入单词,至少我在 URL 里没看到 redirect=)——词条
    一来对于心智状态的打断很严重,二来这个 6 秒就很没意义,纯粹空耗时间。另外建议接入第三方登录,Github/Google/Apple 等。
    3 、首页的推荐词有反爬么?我大概试下……
    4 、不用 Chrome…… 实际上因为注册劝退我也没去试过什么。8 秒延迟见 1 、
    5 、你的 idea 不具有技术门槛,idea 不受版权保护。因为太短,版权保护的实施是有难度和争议的,基本可以拖到去世。
    6 、我说的 Wiki 模式是指维基的 “众包” 模式,用户可以自由的添加,不会侵犯你的版权,甚至因为名义上是 UGC,侵犯版权可以套用避风港原则。质量确实会变得参差不齐,但能够在很短时间内变得极其丰富。

    再引申一下,
    7 、你的推广模式是?阻止了未登录的访问使得 SEO 无效化。看来只有口口相传和做广告了。
    但未付费无法访问仍然是在口口相传上的一道槛:我推荐你个 XXX 。一看,要付费才能看到你的特色。还是心理账户的说法:对于一个价值不确定的事物,却要花掉价值非常确定的金钱。哪怕这个价值的数学期望等于这个金钱,但仍然让人望而却步。
    本来按 PG 说法,口口相传是最重要的方式,因为它是几何级数的。但你破坏了这个流程。

    说起来我想起来一个挺不错的功能:
    8 、vs-trick,参考: https://medium.com/applied-data-science/the-google-vs-trick-618c8fd5359f
    no1xsyzy
        131
    no1xsyzy   2020-08-28 20:27:18 +08:00
    话说,
    9 、实质是卖信息差。但直接贩卖信息差是自我毁灭的商业模式。更恰当的方式是贩卖“打破信息差”这件事。
    bzj
        132
    bzj   2020-08-28 21:01:15 +08:00
    本来都加入收藏夹了,看到要强行注册直接删除,我 Google 一下不比查你这个词典更简单高效?
    PEIENYKYK
        133
    PEIENYKYK   2020-08-28 21:34:04 +08:00
    要注册啊,不好意思算了。。。。
    love
        134
    love   2020-08-28 21:38:56 +08:00
    典型的伪需求。
    我做个站直接返回维基百科的内容都比这个内容更适合。
    futou
        135
    futou   2020-08-28 21:45:54 +08:00
    @bjzhush #128 之所以叫专业词汇难道不说明是面向专业从业人员的吗?一方面不懂专业词汇叫什么专业人士,另一方面不是某个专业的又有什么需要去掌握相关的专业词汇?总不能只面向专利审查员吧?
    不是给你们泼冷水,只是建议你们深挖一下目标用户,构建超过右键搜索优势壁垒。
    另外考虑先扩大用户量和丰富内容。就目前的内容来看,#64 说的很对,很多的词汇解释并不能带来足够的信息量。
    dioxide
        136
    dioxide   2020-08-28 23:06:30 +08:00
    注册劝退, 怎么好像随便搭个平台都觉得自己有资格问客户要手机号.
    rebeccaMyKid
        137
    rebeccaMyKid   2020-08-28 23:48:13 +08:00
    @laike9m 哈?大佬你这英文水平为啥会觉得这不错。我没登陆,就看了几个示例。直接 google 看 wikipedia 或者官网不就解释了吗。。这词典有啥用啊。。
    jedihy
        138
    jedihy   2020-08-29 02:29:03 +08:00
    伪需求还要注册才能搜,没见过这样玩的。
    Junzhou
        139
    Junzhou   2020-08-29 08:36:50 +08:00
    关于之前的楼层里我也提到了,如果是我,需要注册才能使用,我可能不会使用。

    还有就是示例的查询结果,这个体验是没有意义的,单纯几次词的体验,并不能佐证词库很全,质量很高。

    但是完全开放式的体验,估计你们不放出来也可能是为了反扒吧,其实 github 上就有很多的类似的公开服务,只不过形式可能是 md,做出这样的服务,其实对于绝大数软件开发人员来说成本并不高,v2 上有很多人,都能很快的开发出一个船新的产品,甚至能覆盖到移动端,浏览器扩展等形势,即使一个人不够,完全也能以开源的方式进行。

    你说中国人的英语不好,但是针对开发人员来说,专业词汇水平还是在水准之上的,起码没有想象中的那么拉跨。很多人并没有标榜免费,而是单纯的觉得不值得付费?(没有恶意,wiki 也是能查的,甚至更全,也并不一定比你们繁琐)
    Junzhou
        140
    Junzhou   2020-08-29 08:39:04 +08:00
    如果真想运营起来,一开始就收费的模式,确实不如前期免费培养用户习惯来的理智。你们做的这个东西,从内容上本质上是没有壁垒的,技术上也没有。
    hi543
        141
    hi543   2020-08-29 14:45:17 +08:00
    什么东西,查个词试试还要我登陆?
    masker
        142
    masker   2020-08-29 16:22:24 +08:00 via Android
    这就是一上来就想收智商税的典型案例吧。
    tonytony98
        143
    tonytony98   2020-08-30 12:38:41 +08:00
    媒体小编来报道,翻遍了网络没找到邮箱或能私信的地方。不得已直接留言吧,楼主有兴趣跟我联系微信:fengyutanjun,务必注明来意。
    brewin
        144
    brewin   2020-09-18 16:11:52 +08:00
    其实程序员不会遇到多少专业词汇,真正面对专业词汇的是科研人员
    1  2  
    关于   ·   帮助文档   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   1416 人在线   最高记录 5497   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 17:23 · PVG 01:23 · LAX 10:23 · JFK 13:23
    ♥ Do have faith in what you're doing.