現在相對（最）好用的 AI 模型是哪個？

This topic created in 470 days ago, the information mentioned may be changed or developed.

最近和朋友聊天說到了 ChatGPT 那個最貴的 o1 版本，官方售價一個月 200 美金。又聊到了 DS 的。因為我和朋友都沒用過 DS 的所以不好評價，我倒是用過一些其他的免費版本的，但基本都沒有體驗過付費。

從朋友的描述，GPT 200 美金那個版本已經能作為一個研究生畢業的人的一個思維了，加上他數據中海量的知識點比普通任何一個人都全面，所以在實際使用上他基本能回答所有的問題。

另外還有一個版本可以聯網使用以此增加更多最新的信息點。

聽起來非常不錯，加上 DS 鋪天蓋地的文章說比 GPT 強大等等，突然有想試試付費版的衝動。

現在想了解下現有的這麼多大模型裡面哪個是最好用的最全面的，或者說更出色一些？不考慮到價格，想買一兩個月試試水。

平時需求基本在：

充當搜索，替代谷歌
幫助理順一些代碼邏輯，+ 幫助在需要調用庫的時候更快理清庫的 API endpoint
在上手一些新的設備/軟件的時候能夠當成一個說明書使用（搜索的進階）
解決一些深層的思考/數學難題，能提供解題思路，甚至能當老師來講解。
私人助理式幫助解決各種問題（這個短期可能暫時沒有任何 AI 能夠實現）

Supplement 1 · Feb 13, 2025

有沒有哪個平台現在能支持 All in one 的？

ChatGPT

11 replies • 2025-02-16 10:31:28 +08:00

mumbler

Feb 12, 2025

gemini 是目前公开模型里面排名最高的，而且 aistudio.google.com 免费使用

aliyaoming

Feb 12, 2025 via iPhone

deepseek

Solix

Feb 12, 2025 via iPhone

o1=ds r1

yy306525121

Feb 12, 2025 via iPhone

ds 重在推理，claude 重在代码

msg7086

Feb 13, 2025

gemini flash 挺便宜。要高质量又不怕花钱的话可以上 claude 这些。

yinmin

Feb 13, 2025 via iPhone

deepseek 推理的确厉害，但是知识库还是比 chatgpt 差一些。有些 stem 知识 deepseek 不知道，再推理也推不出来。

yinmin

Feb 13, 2025 via iPhone

deepseek 有一个优点：用 gpt 多了，人的能力会退化；用 deepseek r1 仔细阅读推理过程，人的能力会提升。

TigerS

Feb 13, 2025

@gaobh 簡單看這兩個看似一樣但還是在一些地方有區別

@yy306525121
@msg7086
如果考慮到推理，代碼等是不是 Claude 還更好一些？

msg7086

Feb 14, 2025

@TigerS Claude 质量普遍是更好的，cursor 默认就是用的 Sonnet ，唯一要担心的就是价格。
Claude 3.5 Sonnet 是 3&15/M ，对比 Gemini 2.0 Flash Exp 是完全免费，就算用正价版的 Flash 也只有 0.1&0.4/M ，价格差距是 30 倍。要是要我自己掏钱，那我选便宜点的，顶多反复多问几次。

TigerS

Feb 14, 2025

@msg7086 和一個嘗試過 Claude 的朋友聊了聊，他現在主要還是用 GPT ，他說如果單純說寫代碼 Claude 的確強大一些，但是如果用到數學模型，解決複雜的數學問題等等，Claude 就和 GPT 差別大了。

他說了個比喻，GPT 對於他的問題，各類複雜數學模型和數學問題，（他是做量化交易的所以對於數學模型需求非常大） GPT 就像一個數學專業（甚至全科）的研究生，甚至有的時候 GPT 還能反駁你的一些想法，最後證明 GPT 是對的。而 Claude 在寫代碼上是本科水平，但數學專業及思路等問題上最多是個高中水平。

不知道這樣比較對不對。

msg7086

Feb 16, 2025

@TigerS 数学方面我就不清楚了。这种情况的话最好就是多个模型换着用。
比如现在流行让 R1 专门负责思考，做一些规划上的东西，规划完了以后切到 sonnet 根据规划的文档去写实际代码。