感觉 claude 逻辑性还是不如 gpt3.5

问题:“有两扇门，其中只有一扇门背后是天堂，每扇门口都有一个守卫，一个只说真话，一个只说假话，你不知道谁说真话谁说假话。你想进天堂之门，但是你只能问其中一个守卫且只能问一个问题，那么你应该问什么问题，才能够得知哪一扇门背后是真正的天堂之门？”

此时 gpt3.5 回答一下子就给出了正确答案，只是有几个论证的地方词语给错了，但是逻辑和结论是正确的，此时我给他纠正一下，它就反应过来了；而 slack 里的 claude ，甚至是 poe 里的 claude+，回答都是错的，尤其是 claude ，无论我怎么引导，指出它的逻辑错误，它只是一直自说自话，又把错误答案换个意思表达出来(认错态度还挺好的)，即使我最终把正确答案告诉它，并且把逻辑论证过程给它，然后让它再答一遍，虽然它此时能照搬我给它的答案，可是推理论证过程还是那老一套错误的，给人气得够呛。看样子它是无法理解这个答案背后的逻辑。

各位感兴趣的可以自己尝试一下。

hckisme

2023-06-17 21:16:42 +08:00

纠正之后，gpt3.5 回答:
在这个问题中，您可以向其中一个守卫提问：“如果我问另一个守卫哪扇门通向天堂，他会告诉我哪一扇门？”。

由于其中一个守卫只说真话，另一个守卫只说假话，因此，无论您问的是哪个守卫，他们的回答都会是错误的。当您问完这个问题后，您可以根据守卫的回答来确定哪扇门通向天堂。

例如，如果您问的是说真话的守卫，他会告诉您说假话的守卫会指向不是天堂的门。这意味着，真实的天堂门是另一扇门。反之，如果您问的是说假话的守卫，他会告诉您说真话的守卫会指向正确的门，这也意味着真实的天堂门是另一扇门。因此，通过这个问题，您可以确定哪扇门通向天堂。

xdygxh

2023-06-19 20:07:29 +08:00

Poe 里面的 Claude 感觉都是削弱过的，Claude 甚至比 Slack 中的能力差很多，Slack 中虽然废话多，但是某些情况下很有用，逻辑性也还算行，Poe 感觉就是傻子。Claude 100k 对比国内某套壳网站搭载的 Claude 100k ，感觉思维发散程度很低，让他写点东西，支支吾吾憋出一点，套壳网站就能哗啦啦给你写一大堆，而且写的很好，不知道是参数设置问题还是什么。

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/949605

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.