词频辅助阅读,一个想法的验证

2019-10-15 11:48:05 +08:00
 josherich

https://josherich.github.io/gradient-reader/

分享一个验证想法的 demo,主要功能是根据词频在文字背后加入对应的灰度

这里有几点可以探索的地方:

2370 次点击
所在节点    分享创造
9 条回复
est
2019-10-15 12:06:12 +08:00
我打开就看到一个 textarea 一段文本。我漏掉了什么吗?
josherich
2019-10-15 12:17:36 +08:00
@est 是楼主失误了,网络这么慢还用异步载入字典,刚改成了同步,刷新一下就有了
grimpil
2019-10-15 12:35:10 +08:00
如果是根据情感分析给文字加上不同的背景色,会不会很花很辣眼
oisc
2019-10-15 13:47:46 +08:00
楼主想法很好,我这里给个拙劣的建议。我们一般说词语有 content word (内容词) 和 function word (功能词),按照 IDF 挑出来的词一般是内容词。但是中文作为一种表意的语言想要做到准确是需要功能词支撑的,词的粒度是不是太小了?
可以参考一下英文的一些技术:
曾经很火的 https://www.spritz.com demo: https://codepen.io/keithwyland/pen/JztfD

另外有本书叫 《眼动追踪和中文阅读》,希望楼主能继续研究下去。
josherich
2019-10-15 21:40:39 +08:00
@grimpil 我也考虑过情感分析,但情感分析(正反面情绪)一是适用的文字类型很有限,比如影评,对话;二是其本身是否准确我也非常怀疑
josherich
2019-10-15 22:17:36 +08:00
@oisc 对,这里其实只用了全局词频,如果对文档词频平均,一些主题词会变淡。但有时主题词是需要的,可以帮助读者定位文本中关键的几个方位。
你说的没错,这个工具的目标是突出语义层面上的比较和变化,从字到词,到短语句子,再到段落,我的感觉是不同层面需要结合起来运用。
感谢推荐,我去看看
zhigang1992
2019-10-17 14:40:07 +08:00
josherich
2019-10-18 09:39:48 +08:00
@zhigang1992 这个是用了英文中的词根 /词干 或者说 unique prefix 来加快阅读速度,中文没法这么标记。
我的想法是用标记词频的方式,既可以突出重点词,也可以起到英文中空格的作用
killpigman
2019-10-18 15:22:55 +08:00
我看着颜色怎么都一样??

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/609464

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX