如何把一个单词分解成词根+词缀的组合?

2022-08-18 10:46:07 +08:00
 arvin01
假设已经有了足够丰富的词根词缀表,如何把一个单词分解为词根+词缀的组合?

对于多词根、多词缀的单词呢?
1911 次点击
所在节点    问与答
25 条回复
xtreme1
2022-08-18 10:51:35 +08:00
不规则的情况太多了, 我觉得爬点什么东西然后直接查表比较好
例如: https://en.wiktionary.org/wiki/ambassador
jiezhi
2022-08-18 11:00:03 +08:00
Tire
jiezhi
2022-08-18 11:01:05 +08:00
@jiezhi #2 Tire -> Trie
lambdaq
2022-08-18 11:02:33 +08:00
一般都是靠穷举
murmur
2022-08-18 11:03:13 +08:00
德语可以这么学,英语就算了,死记硬背是最快的,比如人家跟你说 cardinal ,card 是心脏的词根( cardiac 心外就用这个词)

然后你,啊,card 不是纸牌么

可拉倒吧
arvin01
2022-08-18 11:05:22 +08:00
@xtreme1 谢谢,预加载的话,对存储就有要求了,放本地占空间,远程占带宽,不得已不想用~
arvin01
2022-08-18 11:07:25 +08:00
@murmur 把单词分解一遍也更好背吧,来自英语渣的幻想
arvin01
2022-08-18 11:08:23 +08:00
@lambdaq 我也想到穷举,但具体的穷举规则不知道怎么写
arvin01
2022-08-18 11:09:59 +08:00
@jiezhi 太泛了,能具体点吗?
Vegetable
2022-08-18 11:11:14 +08:00
如果你说的是英语的词根词缀,感觉这是一个非常复杂的问题。英语并没有那么规则,想通过普遍的规则分解出词根来的难度,应该大于穷尽法。
Jooooooooo
2022-08-18 11:14:57 +08:00
如果是背单词不要这么搞.
heganyuliang
2022-08-18 11:20:31 +08:00
如果目的语言是英语的话,没有必要,因为英语日耳曼语和罗曼语的混杂太厉害了,弄起来当然挺好玩,但是对提高自己英语水平应该帮助不大
Morriaty
2022-08-18 11:29:40 +08:00
NLP 领域有个 lemma / stem 的概念,大部分 nlp 包都有对应的功能,但这个基本是词干提取,我还真没见过词缀提取
arvin01
2022-08-18 11:33:33 +08:00
我查了下资料,说几乎所有的英语单词都是由词根词缀组成的,但不管是中文圈还是英文圈,都没有查询单词词根词缀的工具,就很奇怪
wowodavid
2022-08-18 11:34:06 +08:00
英语的话比较难,主要是血统太不纯正了
拉丁语的话(排除外来词,不多)可以做到
seraphv3
2022-08-18 13:01:49 +08:00
宋维刚的词霸天下课程,把按 3 万 8 千较高统计词频的单词进行了彻底的词根词缀拆分,我去年买来学了几个月,不过只学了前 200 个词根
DarkCat123
2022-08-18 13:16:58 +08:00
y1y1
2022-08-18 14:40:12 +08:00
因为实际上没啥用,大多数词根词缀对记忆单词都没有什么帮助,因为意思并不明确。
可以看一下李平武老师写的关于这方面的几本书试试。。
arvin01
2022-08-18 14:54:08 +08:00
@Morriaty 词干提取完了,是不是剩下的就是词缀了?
arvin01
2022-08-18 14:58:15 +08:00
@seraphv3 这个在 GitHub 上看到了 PDF 版,文件好大,几十兆

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/873669

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX