Python 英文单词统计有什么好的库吗?

2018-09-11 10:34:21 +08:00
 lixuda

python 英文单词统计有什么好的库吗?谢谢

3415 次点击
所在节点    Python
25 条回复
holajamc
2018-09-11 16:26:18 +08:00
Aether
2018-09-20 12:50:23 +08:00
虽然你有不必要的情绪,但我觉得这不属于问题的范畴。如果你翻看过我的发帖,你会发现我之所以回复你是因为我之前做过一些相关的工作,觉得也许对你可能有所帮助。至于有些人觉得我有什么姿态,我只能说是相如心。

我看了下回复,大概意思没有任何回复者至少和我一样,曾经真的动手解决过类似的实际问题。

如果你只需要简单粗糙,那么按照空格分拆就足够好,数组就可以满足你的需要。

如果你需要清洗,问题就变多。英文里有些单词的变化形态是跟着句型走的。所以你需要先做句子拆分,然后根据上下文做词性还原。有了词性,你才能把单词还原到正确的原始形态,才能得出足够精确的统计。

关于词性还原所需要的库我记得有专门的,大约是 2-3 个可选,各有优劣。自然语言库很强大但也有不足之处,其中也包括比较繁琐的部分。此外还有大小写、专有名词等问题,都需要一一解决。

并没有直接回答你的问题,但还是希望对你有所帮助。
lixuda
2018-09-20 13:03:10 +08:00
@Aether 谢谢你的回答。情绪不会有,求问,当然是提问者的原因,所以我增加了描述。
Aether
2018-09-20 13:17:48 +08:00
@lixuda 我搞错了发帖人和楼下回复人了。道个歉(捂脸.gif ……)
wizardforcel
2018-09-27 23:01:21 +08:00

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/488091

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX