问个机器学习的问题,用训练好的小模型串联使用可行吗

2023-02-18 16:47:32 +08:00
 lizon

我不是做机器学习的,缺乏相关领域常识

最近看 chatGPT 都是说训练大模型,感觉是想一个模型干很多事

我想以后网上会不会有很多训练好的小模型,都只解决好一个小问题,然后把他们的数据输出对接起来,再当成整体进行训练,得到一个可以处理复杂任务的组合模型

大家可以自行选择训练好的小模型组合成复杂模型,也可以自己从头训练效果更好的小模型

我个人不希望强 AI 被某几个巨头公司垄断,不知道以后 训练自家的小模型 和 串联小模型训练复杂模型 有没有搞头,普通开发者有没有机会参与一下

1539 次点击
所在节点    机器学习
6 条回复
NoOneNoBody
2023-02-18 17:58:49 +08:00
这个问题……
一般模型就是针对具体应用的,至少目前是这样

例如一张人像风景照片,问这是谁什么时候在哪拍的?
实际上从问题就已经分隔出三个子问题处理了:谁、年龄、地点,对应人脸识别、年龄识别、风景点识别三个模型

有些很难分割的问题,它直接对应的就是一个模型
例如 A 、B 、C 哪个好?要么按一些特定标准分割打分,要么将所有人的回答一起训练学习。前者是标准很清晰的时候,按机器学习方式进行,后者是标准很模糊甚至权重不同影响答案较大的,按深度学习进行

然后,你的问题还有另一个层面,不知道你是否指这个?
就是数据采集,巨头可以采集一亿人的身份证做一个模型,但能不能十万个小单位各自采集一千人的身份证做模型,这十万个小模型合起来用?
答案是很难,还是要元数据合起来做模型,而不是一堆模型合起来
模型已经是半成品,不能还原原始数据
Muniesa
2023-02-18 18:32:29 +08:00
串联小模型应用很多了,比如 OCR 是拆成文本检测、方向分类和文字识别,至于你说的当成整体训练,如果模型内部是分开的,和单个模型分开训练没有区别,如果要共用结构,那其实就是大模型。
Windn0
2023-02-18 20:14:51 +08:00
只能说你突发奇想,想太简单了。
nightwitch
2023-02-18 23:37:34 +08:00
"再当成整体进行训练,得到一个可以处理复杂任务的组合模型"

本质上不就是拼成了一个大模型?
分阶段做处理也不是什么新思路了,你翻翻 2011 年附近的论文那个时候显卡还很弱鸡,也没好用的 dl 框架,拿到一个复杂任务都要分好几个阶段用不同的模型去处理
sujin190
2023-02-19 10:09:55 +08:00
只是量变累加并不能得到质变
sky497134710
301 天前

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/917187

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX