2 个月前,Claude 根据我的需求可以非常高效合理的工作; 1 个月前,它成了我的噩梦; 2 个星期前,Codex 根据我的需求可以非常高效合理的工作; 1 个星期前,它成了我的噩梦;
咋搞啊。
2 个月前,Claude 根据我的需求可以非常高效合理的工作; 1 个月前,它成了我的噩梦; 2 个星期前,Codex 根据我的需求可以非常高效合理的工作; 1 个星期前,它成了我的噩梦;
咋搞啊。
1
lemoncoconut 2h 32m ago 技术发展的阵痛期。等开源模型追到了那根完全够用的能力线,每个人都有能力获得、部署一个稳定不降智的模型时这个问题就解决了。
|
2
Rickkkkkkk 2h 30m ago
其实都是上下文、约束没给充足导致的,模型的能力不用怀疑。
一个解法是,尽量缩小任务的模块。一次只交给它一件事来做,不要扔一个超大的需求里面好多功能点。 可以一个功能点一个功能点让它来实现。 |
3
YanSeven 2h 29m ago
@Rickkkkkkk 需求得在厂商没有降智推新模型的前提下
|
4
plmsuper8 2h 23m ago
@Rickkkkkkk 然而这是两码事,原来可以做到,现在做不到了或做不好了,但自己并没有删掉约束,这也不是个例。
|
5
ltaoo1o 2h 21m ago
@YanSeven 怎么才算「给足上下文和约束」呢。我觉得我给足了上下文,没有达到预期效果,我继续补充,仍然没有满足预期效果,继续 补充->没有效果->补充->没有效果 这个循环是无穷尽的,为什么不能认为就是模型能力不足呢
|
7
lujiaosama 2h 16m ago
@lemoncoconut 即便未来能够在本地部署现在 GPT5.5/CLAUDE4.8 级别的大模型,恐怕程序员仍然只会追逐最顶级的在线大模型。和水涨船高一样。
|
8
m1nm13 2h 15m ago
把 AI 当许愿机是这样的
|
9
lovelyidiot 2h 6m ago
还是概率模型,缺少思考和推理能力。稍微资料少一点的内容就能做的一团糟,设计能力一般。总体就是大众水平 60 分,还替代不了 80 分的程序员。
|
10
qf19910623 2h 0m ago
模型本身不确定性太大,如果你一直许愿式编程,那就很难顶。未来的方向是人工制定架构,这一步也可以让 AI 来做,但是需要人工审核,后续实施再交给 AI ,这时你只需要一个能够严格遵循指令的模型就够了
|
11
Rickkkkkkk 1h 55m ago
@ltaoo1o 问题太常见了。一方面可能确实是模型的能力不足以完成你的要求;另一方面还可能是有一些隐藏(或者你认为理所当然)的东西你忘记告诉它了。
我的解法是,一、不要把你感觉大模型确实无法完成的东西交给它;二、任务足够小,好处是上下文可以少。 另外你也可以观察大模型本身的思考/输出,看看具体是什么问题导致它做不来这个事情的。这其实要求你自己本身可以干这件事,要不然你分辨不了它到底是卡在了什么地方。 当下(一年甚至半年后就说不好了)大模型所展现出来的能力我感觉是协助者,类似于你带了一个校招生。你不会干的事情,那最好也不要给它干。 |