把英文书籍中符合难度的单词提取出来,然后用树莓派、闲置的屏幕、挂墙上的手机来背单词

2018-08-19 10:48:01 +08:00
 lxrmido

想法

家中有个树莓派一直在跑爬虫,最近淘宝买东西的时候顺手买了个 50 块的 3.5 寸屏幕插上去,然后发现屏幕无法关闭,于是便想拿它来做点什么,反正屏幕的耗电量才 0.5W 。

最近也一直在用薄荷阅读学英语,感觉背单词是学英语里最重要的一环。

于是思路就出来了:

单词从哪里来?

如何生成单词卡片数据?

作品

有了思路之后,做起来还是比较容易的。花了两个晚上把可用的版本做了出来,repo 地址:

https://github.com/lxrmido/WordCards

树莓派运行效果:

界面截图:

然后就是再抽空把需要的其他东西做出来,以及优化了

总结及体会

6953 次点击
所在节点    分享创造
73 条回复
dongpeng121
2018-08-19 11:05:08 +08:00
如果训练的文本够多,是不是可以把重复率超过一定值的单词滤掉,认为这些单词已经掌握了?
ww2000e
2018-08-19 11:08:06 +08:00
想知道你家爬虫都爬些啥
chroming
2018-08-19 11:12:23 +08:00
不错不错,我的吃灰派又可以掏出来玩两天了
lxrmido
2018-08-19 11:25:58 +08:00
@dongpeng121
好像确实是这样,这就要在生成词库的步骤里引入训练的环节了
lxrmido
2018-08-19 11:26:35 +08:00
@ww2000e
各种想爬的数据,哈哈
mathzhaoliang
2018-08-19 12:41:05 +08:00
学英语的话,这种背单词卡片的方式效率很低,(李阳的疯狂英语我认为也不适合大多数人)以前经常看到宣传上说某某人学英语刻苦,背红宝书背 webster 字典,这些其实不可取。

最好的学习英语的方式是结合情景。比如 "excited", "naive",“ he changed the world ”, etc. 张口就来有没有?

电影肖申克的救赎里面有许多值得学习的对白,比如在天台上干活时哈德利抱怨税务局要收他一大笔税,安迪走上去问哈德利“你信任你的妻子吗”,哈德利怒道 "what's your malfunction?" (你哪根筋不对?)这不就学到一个 GRE 词汇?(顺带骂人不吐脏字对面还听不懂)

再比如功夫熊猫里面也有很多精彩的对白如 "there's no secret ingredient","one always meets his destiny on the road he takes to avoid it",等等。

我觉得你可以屏幕上每次显示某个电影的某个场景,配上台词,每次看到以后模仿电影中的语言把它念出来,倍儿有感觉,而且绝对忘不了。
zzcchh
2018-08-19 12:46:38 +08:00
我记得 interest 还有利息的意思。
lxrmido
2018-08-19 14:06:17 +08:00
@mathzhaoliang

情景记忆确实好,就是获取、整理的难度比较大
ghhardy
2018-08-19 14:28:58 +08:00
@mathzhaoliang 那不就跟百词斩差不多了,这种情境式记忆很多项目都在做,不过确实有难度,我能想到的是利用电影字幕的时间标签进行截屏。不过与其用这种方法片段式地记单词和句子,还不如利用视频资源去充分地带前后语境去学习,哪怕十分钟,都会有不少收获。
ghhardy
2018-08-19 14:33:57 +08:00
@mathzhaoliang 当然,楼主这个小项目非常好,非常感谢楼主的分享🙏
kingcos
2018-08-19 16:33:28 +08:00
词库是他开源的?
daigouspy
2018-08-19 16:52:34 +08:00
用折腾的决心自己去学英语你早雅思 4 个 9 了。天天捣鼓系统调试程序哪有心机学习英语。
RqPS6rhmP3Nyn3Tm
2018-08-19 16:54:38 +08:00
@mathzhaoliang 还要背一遍葛底斯堡演讲?
lxrmido
2018-08-20 08:34:14 +08:00
@kingcos
是有其他来源?
wensonsmith
2018-08-20 17:01:50 +08:00
@mathzhaoliang 是的,看权利的游戏,瞬间就记住一个单词:Bastard
mrfox
2018-08-20 17:07:45 +08:00
非常感兴趣。感谢,很好的项目,一点建议供参考:
1. 有些还没搞明白,展示页面上有两个图标,一个是删除一个是星号;这个界面是不动的对吧,按删除可以看到下一个单词(删掉了?可以考虑熟词进入熟词表?),但是按星号似乎没反应,那就是收藏起来了,然后再按删除进入下一个展示?(星号应该是保留了继续背对吧)
2. 符合需要的提取单词:适合个体的最佳方式是自己有自己的词库,因为常见的词频表只能是大概,每个人认识与否的还是不同的,比如分别存入 known.txt ,new.txt 。希望增加一个生、熟词筛选的功能。已经有自己熟词表的可以直接覆盖(或导入),而没有的人可以从头开始积累。界面上增加下操作快捷键,比如按 1 是认识,按 2 是生词
3. 请问单词复数和动词形态的处理原则,是不是都不还原?
lxrmido
2018-08-20 18:30:59 +08:00
@mrfox
1、删除之后单词会被标记为 ignore,以后都不会再显示这个单词,星号点击之后应该是会变红的,其实这两个就是熟词表跟生词表,但目前没有针对这两者实现其他功能;
2、对的,准备结合 1L 的建议加入熟词筛选的功能,而快捷键,打算把所有可点击的都加入可配置的快捷键,毕竟每个人的操作设备也不同;
3、目前的单词处理方式比较粗暴,就是从词典里找完全匹配的,本来打算针对单词的形态提取词根,然后发现词典里有词根的单词数量占比很低,所以搁置了;
mrfox
2018-08-20 18:54:14 +08:00
@lxrmido 正在测试,新发现了页面左右有前进后退按钮:),快捷键是个好消息,希望早日完成
点星号是会变红,不过点删除它是自动跳转下一个,为什么点星号不跳到下一个呢,毕竟已经处理完了,如果是特意为之,建议变成一个可选配置

刚刚的一个词 https://imgur.com/a/XJhSMFI
是不是句首词也没还原呢

另外,释义长的话字体会突然变得很小,希望保持统一

good job
mrfox
2018-08-20 18:56:58 +08:00
@lxrmido 我又看了一眼图,发现不是句首词,上面描述有误,原文里是没大写的,不知道是不是字典的问题还是什么
mrfox
2018-08-20 19:48:23 +08:00
提示小白如我的:终于明白了这个 ignore,不再显示出来,开始我试的时候点星号看不动就点了删除,结果这个词应该是既标为生词又不再显示了,这个……应该是点向右,个人觉得先点星再点删除应该是不允许才对

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/481114

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX