一道三年级数学题把大模型难住了,不是说数学推理都很厉害吗

3 天前
 goodryb
昨晚辅导儿子作业,本来想秀一下大模型,结果翻车了

原题目是:一笔画(隐含意思是不能走回头路),从红色位置开始 经过图形中的每个方块,其中灰色的方块不能经过




试了下 qwen 、豆包、gemini 都没做出来,其中 qwen 一直深度思考,豆包给的答案是错误的,gemini 说这个题目无解,但确实是有正确答案的


是题目太刁钻还是我使用的方法不对,或者说是没找到最厉害的大模型
4200 次点击
所在节点    程序员
56 条回复
FlyaiF
3 天前
图片没解析出来,然后我用 ascii 解出来了,最后让生成图片也符合要求,用的 gpt-5
FlyaiF
3 天前
bikeread2008
3 天前
claude code 一把出,输入图片和原始题目,自己写了个 python 脚本,大概瞄了一眼说是什么哈密尔路径?然后就把输出路径用数字标注出来了
goodryb
3 天前
@donaldturinglee 入口或者说起点是明确的,路径和出口都要自己找
bikeread2008
3 天前
deplives
3 天前

gpt5 thinking 回答的没有问题
MAYE4040
3 天前
这个对于强化学习模型(类似 alpha 狗)来说属于很简单的
Tink
3 天前
动态规划问题
ddddd0
3 天前
https://chatgpt.com/share/6901b398-6fe4-8001-b251-feecda6d59a6

免费版的 chat gpt

我只是把你的帖子正文里的图片和描述粘贴给他

5 分钟不到一次成功
FarAhead
3 天前
@coefu #9 汽车也不就是马车换了个动力,也只是高级了一点罢了
lepig
3 天前
有点意思。 不过我更想知道的是,这个题是想考察三年级学生的什么能力
lesterchen
3 天前
之前 qq 飞车有一个活动,M*N 的矩阵.你点亮一个点,这个点周围的点也会被点亮或熄灭.目标是点亮所有的点.好几个题目都试了.AI 给的答案都是错的.搞得我只能自己想.
coefu
3 天前
@FarAhead 类比水平有待提高。汽车马车是陆地交通工具,但是当前主流定义的 AGI 的追求所对应的是虫洞瞬间穿梭。你觉得汽车能达到吗?你把汽车设计到超声速贴地飞行,也还差的远。
ljl024
3 天前
目前阶段还不是强项吧

https://ai.google.dev/gemini-api/docs/prompting-strategies?hl=zh-cn#things-to-avoid
>需要避免的事项
>- 避免依赖模型来生成事实信息。
>- 对于数学和逻辑问题请谨慎使用。
autozzz
3 天前
把 op 的回答复制给 gork,gork 也可以,结构也是对的,思考过程的代码:

import itertools

# Define the grid
rows = 5 # 0 to 4
cols = 8 # 0 to 7
all_points = [(x, y) for x in range(cols) for y in range(rows)]

# Forbidden points
forbidden = {(0,0), (0,1), (3,1), (5,4), (7,3), (7,4)}
valid_points = [p for p in all_points if p not in forbidden]
num_valid = len(valid_points)
print(f"Number of valid points: {num_valid}")

# Function to get neighbors
def neighbors(point):
x, y = point
cand = [(x+1,y), (x-1,y), (x,y+1), (x,y-1)]
return [p for p in cand if 0 <= p[0] < cols and 0 <= p[1] < rows and p in valid_points]

# Build adjacency list
adj = {p: neighbors(p) for p in valid_points}

# Backtracking to find Hamiltonian path starting from (1,0)
start = (1, 0)

def dfs(current, visited, path):
if len(path) == num_valid:
return path
for neigh in adj[current]:
if neigh not in visited:
visited.add(neigh)
path.append(neigh)
result = dfs(neigh, visited, path)
if result:
return result
path.pop()
visited.remove(neigh)
return None

# Run the search
visited = set([start])
path = [start]
result = dfs(start, visited, path)
if result:
print("Path found:")
for p in result:
print(p)
else:
print("No path found")
PeterKim
2 天前
各位认真的吗?这是三年级的题目啊?总不能让一个小学三年级的学生对着 AI 写提示词和看各种坐标和英文字幕组成的答案吧?不能因为你们是程序员就理所应当觉得所有人都要懂吧?从这个角度出发,目前的 AI 对于各个年龄段的普通人来说不就是聊胜于无吗?

明明是一道三年级的题目,没有一个人是试图站在一个小学三年级的学生视角下去解决问题,不知道这算不算程序员的一种“自以为是”。
Feeli
2 天前
@PeterKim 确实 把我看愣了
dxppp
2 天前
什么图论
GoodRui
2 天前
仔细看楼主的图,最右侧是无线条的,如果楼主发的就是原图,那我觉得应该是图片有问题,导致大部分模型识图就出现问题。
fredweili
2 天前
多模态的的问题,或者描述不够丰富清晰

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1169107

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX