Go 实现的模型推理和 API 部署框架

2022-07-27 17:31:47 +08:00
 jack139

推销一下 :)

https://github.com/jack139/go-infer

深度学习模型在部署时通常以云方式部署,通过 API 对外体提供推理服务。这个框架提供了部署 API 时的基本架构组件,实现了几个目标:

其他功能:

1920 次点击
所在节点    Go 编程语言
4 条回复
Zhao70
2022-07-27 17:59:33 +08:00
楼主做的这个东西和我工作领域有一些重合度,star 一下。

不过有几个问题需要注意:
1. tensorflow 版本有些低,是 1.15.4 ,貌似不支持 avx, avx2, fma 指令集,建议升级下,大概可以提升 20%的 CPU 打分性能。
2. bert 算法使用了 github.com/buckhx/gobert 这个算法库,这个库在生产环境 Wordpiece Tokenize 存在字符串分片不会被 gc 的问题,再就是对于特殊 query 导致死循环,服务 OOM
Juszoe
2022-07-27 18:32:45 +08:00
看起来不错,有兼容 pytorch 或者 onnx 的打算吗
jack139
2022-07-28 09:11:11 +08:00
@Juszoe 已在 todo list 里,不过对 onnx 不熟,先要学习一下。好像也有 go torch 的路线,也可以尝试。
jack139
2022-07-28 09:14:20 +08:00
@Zhao70 1. 不好意思,因我的环境都还没升到 tf2 ,所以对 1.15 比较熟悉一些。2. 这个也是临时抓来的库做例子,还没有深究。我的生产还在用 py ,目标是要改 go ,所以才搞了这个项目。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/869064

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX