本来我只是在一个 GPU 云公司敲代码的。
前一阵老板说我们有 GPU 资源,得用起来啊!
于是大家来了个头脑风暴,聊来聊去,发现没啥比微调训练更需要算力的了。
那咱干脆就做个低代码大模型微调平台吧。
兄弟们叮了咣啷的搞了 2 个月,终于是上线了。
现在已经能支持一百多种开源模型( Qwen 、Llama 、Yi 、InternLM 什么的都有),LoRA 、QLoRA 、全参数训练都能跑,底层用的 H100 。
不过现在我有个疑惑:
我自己觉得这玩意挺方便的,但我发现我不知道到底是谁,在什么场景下,会真正需要这么一个东西? 😂
我不是来打广告的哈,主要是想跟大家取取经:
一是想看看大家都在什么场景下会做微调;
二是我们这样一个产品大家会用的上嘛?
如果有人刚好在搞微调、或者想跑点实验,可以私我哈,可以给大家搞点额度玩玩。
1
AllenZ0 17 小时 58 分钟前
推给友商。
|
2
hmxxmh 17 小时 54 分钟前 via Android
已经有类似的框架了吧,swift 或者 llamafactory
|
3
skallz 17 小时 50 分钟前
有个经常用到的场景,就是 ocr ,不同业务场景下 ocr 的图片差的很多,一般都需要针对不同场景专门训练,通用的模型在部分业务中效果较差
如果 op 能提供个服务先根据上传的图片自动识别文字,然后再给人工矫正文字,再用这些材料自动化训练,就是个很实用的落地场景了 |
6
okoklll OP @skallz 这个想法很棒哈~ 感觉可以在数据处理工具里预置个 Paddle-OCR 做识别;您说的 OCR 是用多模态模型做吗?还是一些深度学习模型呢?
|
7
RealMan 1 小时 12 分钟前
似乎和 Danqi Chen 他们做的 Tinker 很类似: https://thinkingmachines.ai/tinker/
我个人的观点是这类平台有点奇怪,小公司一般都没有微调需求,RAG+Context engineering 解决 90%任务。对隐私有要求的公司可能会有微调的垂直落地需求,但是他们肯定会选择本地部署,或者自建可控云平台训练。不会上传数据到其他平台训练。 |