我现在的公司就是专门帮其他公司做智能体的。我目前负责的两个项目,一个是面向央企的,总招标千万级别,一个是和化工企业共建的,价值也在百万左右,但是我们做的都是完整的解决方案,如果光是训练模型,可能便宜不少。
但你如果是技术,还是推荐你自己做的。看你的数据是什么类型的,如果是文档型的,和大家说的一样,可以直接用 RAG 。如果非常细的业务场景可以直接微调,几万条的数据已经能有非常好的效果了。
可以参考下这个例子(
https://www.aliyun.com/solution/tech-solution-deploy/2925027 )。从一句话中提取结构化信息,用 1000 条左右的数据,就把 0.6B 模型的准确率从 14% 提升到了百分之 98%。
至于什么时候用 RAG ,什么时候微调,其实一般都是结合使用的。比如那个化工项目,甲方提供了 产品对应的化学原料(例如:塑料的原料可能有聚氯乙烯 PVC 、聚乳酸 PLA 、色母粒等),用这些数据训练产品原料预测模型,输入是产品名称,输出就是预测需要的化学原料。然后还有一些文档,比如某些产品的原料使用标准、基础化工原料介绍,这种就放在 RAG 里,执行任务的时候检索。
价格的话,我自己训练模型一般用这个
https://www.autodl.com/ 里面的机器比常用云会便宜点。比如阿里云 80G 显存 一小时 50 多,这个服务 13 块钱一小时。 你训练的时候可以按照小时买,估计几千块钱 就能支持你训练好模型,部署的时候可以转包年包月。