将任意书籍转换为 rime 词库

1 天前
 whitewatercn

前情提要

半年多前主包开始构建 rime_clinic 医学输入法词库项目,将能找到词库全部改成 rime 格式以后,发现一个大问题:

中医常用的术语并没有人做!

于是主包又开始开发rimetool 工具包,方便医学生将任意中医图书转换成输入法词库(当然,你也可以用于转换其他内容,不止是中医图书)

正式介绍

rimetool 支持 pip 安装,可以将任意长的书籍、论文、文章、句子等转换成 rime 可以使用的词库

你可以直接使用命令行操作,比如

rimetool --t txt -i something.txt 

就可以得到四个词库,任选你需要的版本使用即可

另外也可以部署 web gui ,方便不习惯命令行的用户使用

rimetool web

目前 web gui 已经部署,你可以试试看 https://rimetool.beginner.center/

更详细的 文字/视频版 使用教程 https://forum.beginner.center/t/topic/2160

The End

通过这个项目结识了很多朋友,得到了很多鼓励,学到了很多新知识,接下来会继续完善相关功能,敬请期待

也欢迎各位大佬 pr 、催更

Status board · rimetool todo

741 次点击
所在节点    分享创造
4 条回复
zpvip
1 天前
别助力中医了, 让它慢慢地和辫子, 裹脚布一起消失吧.
omph
1 天前
多谢分享,用的 jieba 分词啊,确实专业词汇还得自己动手
请忽略某些不礼貌的楼层,平和平静平等
whitewatercn
1 天前
@omph 目前的思路:
先用 jieba 分词,之后使用 nlp 分,再往后会基于用户提交的数据结合 jieba 和 nlp 分词(大家打字的时候怎么分词,就怎么构建分词库)
whitewatercn
1 天前
@omph 感谢支持😘

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1158110

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX