最近要做一个 AI 应用落地,一些困惑希望有人可以指导

197 天前
 puppyxxx
  1. 开始读书《大模型 RAG 实战》,经过平台好心人推荐,看了下大模型基础这本书,确实更好一些

  2. 要做一个支持 AI review 代码的功能,开发同学提交代码的时候就 review ,同时可以给出优化代码的建议,这种应用的架构要如何设计呢,有人做过或者有知道哪些好的项目参考

  3. 最近听广播,很多企业都接入了 deepseek ,而且应用在业务中,想了解下,这些业务是如何快速部署和实施的呢

4903 次点击
所在节点    程序员
52 条回复
GreenHand
197 天前
简单的 PE 估计效果一般,需要后训练模型
puppyxxx
197 天前
@GreenHand 是的,目前想 codebert codeT5 这些预训练模型,都需要下有任务继续训练
highkay
197 天前
@puppyxxx 微信 aGlnaGtheQ==,32B 的话,可以考虑 qwen2.5-32B-coder 或者 r1 蒸馏版本,我用的是 deepseek v3 ,数据安全的话,其实还好,就是发出去一些代码片段,你们自己不要把敏感信息写进去就好了(在 ci 里面做一些 check ,直接终止掉流水线),需要指令遵循,严格来讲 code review 是一个封闭问题。
puppyxxx
197 天前
@highkay 好嘞,明白
catamaran
197 天前
@l1905 获取代码变更信息具体指什么操作?
EdwardXia
197 天前
@highkay #5 老哥可以加个微信交流下吗
OHyn
197 天前
医院接入我认为是大模型+知识库,或者针对领域微调的模型+知识库。
公众号上多一个问诊入口,仅此而已。
甚至有知识库的都算是良心了,可能仅仅是 prompt 而已。不要太高看那些一夜之间接入 deepseek 的企业。真懂得用的,不会等到现在才接入。
catamaran
197 天前
@highkay #5 搭车问个问题,gitea 有权限管理吗?就是可以控制账号对仓库的读和写。看官方文档,没找到相关的内容。
andyskaura
197 天前
我博客有个测试文章生成的 demo ,没想到自然流量特别多,有很多人在用那个写小说。基于这个需求业余时间正在做一个小说生成器,但讲真的,越做越没信心,没有付费点。
puppyxxx
197 天前
@andyskaura 接广告试试
hewitt29
197 天前
加个链接就是接入了。。别想太多,哈哈
gegewu0927
197 天前
andyskaura
197 天前
@puppyxxx #30 不太行,现在就接得有 google 广告,国内用户实在是不值钱,点一次 0.01 ,千次展示 0.2 ,半个月了收益还没有 2 块钱。
AS4694lAS4808
196 天前
我是 VSCODE +continue + 公司 claude 3.5 ,经常给多个文件作为上下文,每个月快上百刀了,除非有低成本质量又 OK 的模型能用,或者本地有大集群(手上有 8*8*A800 机器,跑 qwen2.5-72B 也不是很快),否则瓶颈就是成本了吧。。不知道有中小客户能接受的了么
puppyxxx
196 天前
@gegewu0927 看了下,接入 openai 方案不太行,代码合规是有要求的
puppyxxx
196 天前
@AS4694lAS4808 所以这个东西感觉还是得用调 api,但是我一直怀疑的是数据安全
puppyxxx
196 天前
@hewitt29 但是我看新闻,那个模型还能帮助他快速标注出来影像上面的异常点
liaopen123
196 天前
看了一圈评论感觉没有很好的方案。
puppyxxx
196 天前
@liaopen123 问题 2 因为数据安全问题,打算使用公司内部训练的 agent 来处理了,我个人今天的进度
highkay
196 天前
@catamaran 可以的,生成 token 的时候可以选择权限范围。仓库范围是靠你创建发起的层级确定的,比如全局,group 和单个曾库。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1116248

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX