V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  graetdk  ›  全部回复第 2 页 / 共 53 页
回复总数  1042
1  2  3  4  5  6  7  8  9  10 ... 53  
@Eacls 抱歉!我刚刚才看到,数字 DK 我觉得人味儿还可以,但是受限于数据质量和模型(我当时用的 chatGLM),所以逻辑会差很多,如果用更新的基底模型,例如现在的 chatGLM3 或者参数量更大的模型,再结合更好的数据集,效果肯定会比我之前的那个版本好,但是模型训练本身也带有随机性(玄学),所以具体怎么样其实也没有办法精确的预估
感觉甚至都不需要微调,prompt 工程应该就能解决
133 天前
回复了 hui9000 创建的主题 机器学习 公司想搞一个关于 AI 问答的知识库
听上去只要有足够的数据集,很好训练一个是别的模型
为啥不用摩托范之类的 app
160 天前
回复了 graetdk 创建的主题 分享创造 业余做的文本大模型训练 Saas 上线
@LeoSpeaker 我个人是 chatGLM 的粉丝,并且目前我觉得 chatGLM3 是比较不错的
160 天前
回复了 graetdk 创建的主题 分享创造 业余做的文本大模型训练 Saas 上线
@baka 虽然拿到了,但是其实我觉得这个不需要商业授权,因为本质上是算力服务,类似于某些云服务器提供模型镜像或者 GUI 给你操作差不多
161 天前
回复了 graetdk 创建的主题 分享创造 业余做的文本大模型训练 Saas 上线
@titanhw 🫡
161 天前
回复了 graetdk 创建的主题 分享创造 业余做的文本大模型训练 Saas 上线
@czfy 可以的,那样数据集做起来会稍微麻烦点
161 天前
回复了 graetdk 创建的主题 分享创造 业余做的文本大模型训练 Saas 上线
@nno 之前的模型微调后丧失某一方面能力的情况比较明显,但现在的模型都好了很多,另一方面如果需要加强的是模型的特定能力,那损失其它(不需要的)泛化能力也不是不能接受
161 天前
回复了 graetdk 创建的主题 分享创造 业余做的文本大模型训练 Saas 上线
@vulgur 那个我还真想买一个,亚马逊看到要一百多
161 天前
回复了 graetdk 创建的主题 分享创造 业余做的文本大模型训练 Saas 上线
@my6777637 感谢!我们提供的接口并不建议用于实际业务,仅仅是提供一个测试,后续可能会有更稳定的部署系统,但还是推荐用户训练好模型之后下载,自己部署
161 天前
回复了 graetdk 创建的主题 分享创造 业余做的文本大模型训练 Saas 上线
@nnccree 刚开始,之后加
181 天前
回复了 huahsiung 创建的主题 程序员 知识付费就是一个笑话。
遇到这事儿的作者应该可以留存一下证据直接起诉
这个办公室是 wework 吗,看着好眼熟
189 天前
回复了 lwch 创建的主题 分享创造 无需量化,在树莓派上运行 LLaMA2 70B 模型
速度会慢多少呢? 10 倍左右?
我是 foodCa 的开发者,我没办法说你是抄袭,因为虽然概念有相似,但你做的跟我不一样,是我放弃了的那种做法,但是名字能不能不要这么碰瓷啊这不好吧
215 天前
回复了 norcm 创建的主题 iPhone iphone14Pro 更新 iOS17 后掉电巨快
我开发者版本的 17 更新一个月了,到现在依然觉得掉电很快
1  2  3  4  5  6  7  8  9  10 ... 53  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1098 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 30ms · UTC 18:50 · PVG 02:50 · LAX 11:50 · JFK 14:50
Developed with CodeLauncher
♥ Do have faith in what you're doing.