我想训练一个垂直领域快速识别用户意图的 AI,求技术路径指导

237 天前
 wvv8oo
目的:在一个垂直领域内,通过输入自然语言判断用户的意图。意图可以被枚举出来,自然语言在一个范围内。
要求:性能希望能在 100ms 以内,越快越好

目前调研 RASA 中,不知道各位大佬有别的建议吗
1113 次点击
所在节点    问与答
5 条回复
mumbler
237 天前
用 grop 的大模型 API
ggbond2233
237 天前
哈哈哈哈,这题我会 但是 100ms 国内目前做不到
wvv8oo
237 天前
@ggbond2233 自己服务器有可能么
@mumbler Groq 确实挺快,如果实在解决不了,也是一个方案。
mumbler
237 天前
@wvv8oo #3 自己部署 100 毫秒不可能,要尽量快就只能用 3B 以下的小模型,4090 去跑,推荐 gemma2 2B 模型,完成分类还是够用了
ggbond2233
237 天前
用小模型,分类可以做,自己服务器很吃力的
就用之前各家对话平台的模型 都可以实现

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1103159

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX