杀鸡用了牛刀😂,为了达到拼音长句输入的准确性,不依靠网络和大数据确实是一个复杂的问题。一开始我考虑过用词频和字典结合算法,但当句子变长以后就很难了。最后想想干脆用深度学习来解决这个问题。从头开始使用 huggingface 上能找到的拼音数据集针对 IME 做了预处理,然后使用 Bi—LSTM attension 模型进行训练再把训练好的模型通过 int8 onnx 转到 Android 手机上来运行,模型效果和运行速度居然还不错。彻底把这个输入法改成了 AI 输入法
今天做了下模型和 onnx runtime 在本地机器上的优化,速度得到了保障
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.