AI 关于字符串回答总是错误的问题

39 天前
 coderMonkey
提问 AI ,waterTemperature 总共多少字符,AI 总是会发生错误,换了几个平台都这样

1139 次点击
所在节点    OpenAI
17 条回复
chris850527
39 天前
用了 claude 没问题,你可以试试
AoEiuV020JP
39 天前
ai 睁着眼镜说瞎话的问题还是没解决,目前依然算是语言模型,只能保证语言正确,
zsh2517
38 天前
@chris850527 顺便测试了一下 poe.com 上的 GPT4 ,也没有问题。
matrix1010
38 天前
你要知道 LLM 是没有智能的, 更不可能去进行准确数学计算。简单的统计 AI 也许能答对, 但稍微复杂点就完全不行了。比如这个:
how many "r" and "a" in "strawberry"

Gemini 1.5 Pro 的回答

Let's count:
R: There is one "r" in "strawberry".
A: There are two "a"s in "strawberry".
yorhaha123
38 天前
Procumbens
38 天前
你要知道在语言模型里看到的不是词 而是 token...
mightybruce
38 天前
出这种蠢的问题,意义何在?为了显示比 AI 聪明?
这个调用一下函数库就能得到结果,还不如让 AI agent 根据自然语言生成相应的函数调用回答准确。
ibegyourpardon
38 天前
GeekGao
38 天前
@chris850527 Claude 3 Opus 不行,回答也是错误
GeekGao
38 天前
我的测试题目是 #4 提供的这道题
gaobh
38 天前
这个写个脚本就行了吧,没必要问大模型
taotaodaddy
38 天前
OP 和 4#的问题,poe 上的 GPT4 都能做对,是不是生成并调用了 python 程序做对的呢?
billccn
38 天前
@taotaodaddy 可能性大,要不然得训练模型记住每个 token 里面多少个字符,还得训练模型做心算。前者好像不值得花这个时间,后者还是个技术难题。
dayeye2006199
38 天前
因为现在主流的 tokenization 是 subword ,没法很好的处理字符串 level 的问题。
yadam
38 天前
#5 的文章写的很详细, 学习了
如果 op 的流程里一定依赖这种数长度流程的话, 会不会用 tool calling 可以比较完美的解决?
Meteora626
37 天前
输入是 token ,而且还要切分,现在基本上都是 bpe ,输入文本都不知道被切成啥样了,除非有标识符来标识每个字
SmiteChow
37 天前
因为目前都是人工智障,别抱太大希望。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1039858

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX