TigerS
V2EX  ›  问与答

現在相對(最)好用的 AI 模型是哪個?

  •  
  •   TigerS · Feb 11, 2025 · 3151 views
    This topic created in 470 days ago, the information mentioned may be changed or developed.

    最近和朋友聊天說到了 ChatGPT 那個最貴的 o1 版本,官方售價一個月 200 美金。又聊到了 DS 的。因為我和朋友都沒用過 DS 的所以不好評價,我倒是用過一些其他的免費版本的,但基本都沒有體驗過付費。

    從朋友的描述,GPT 200 美金那個版本已經能作為一個研究生畢業的人的一個思維了,加上他數據中海量的知識點比普通任何一個人都全面,所以在實際使用上他基本能回答所有的問題。

    另外還有一個版本可以聯網使用以此增加更多最新的信息點。

    聽起來非常不錯,加上 DS 鋪天蓋地的文章說比 GPT 強大等等,突然有想試試付費版的衝動。

    現在想了解下現有的這麼多大模型裡面哪個是最好用的最全面的,或者說更出色一些?不考慮到價格,想買一兩個月試試水。

    平時需求基本在:

    • 充當搜索,替代谷歌
    • 幫助理順一些代碼邏輯,+ 幫助在需要調用庫的時候更快理清庫的 API endpoint
    • 在上手一些新的設備/軟件的時候能夠當成一個說明書使用(搜索的進階)
    • 解決一些深層的思考/數學難題,能提供解題思路,甚至能當老師來講解。
    • 私人助理式幫助解決各種問題(這個短期可能暫時沒有任何 AI 能夠實現)
    Supplement 1  ·  Feb 13, 2025
    有沒有哪個平台現在能支持 All in one 的?
    11 replies    2025-02-16 10:31:28 +08:00
    mumbler
        1
    mumbler  
       Feb 12, 2025
    gemini 是目前公开模型里面排名最高的,而且 aistudio.google.com 免费使用
    aliyaoming
        2
    aliyaoming  
       Feb 12, 2025 via iPhone
    deepseek
    Solix
        3
    Solix  
       Feb 12, 2025 via iPhone
    o1=ds r1
    yy306525121
        4
    yy306525121  
       Feb 12, 2025 via iPhone
    ds 重在推理,claude 重在代码
    msg7086
        5
    msg7086  
       Feb 13, 2025
    gemini flash 挺便宜。要高质量又不怕花钱的话可以上 claude 这些。
    yinmin
        6
    yinmin  
       Feb 13, 2025 via iPhone
    deepseek 推理的确厉害,但是知识库还是比 chatgpt 差一些。有些 stem 知识 deepseek 不知道,再推理也推不出来。
    yinmin
        7
    yinmin  
       Feb 13, 2025 via iPhone   ❤️ 1
    deepseek 有一个优点:用 gpt 多了,人的能力会退化;用 deepseek r1 仔细阅读推理过程,人的能力会提升。
    TigerS
        8
    TigerS  
    OP
       Feb 13, 2025
    @gaobh 簡單看這兩個看似一樣但還是在一些地方有區別


    @yy306525121
    @msg7086
    如果考慮到推理,代碼等是不是 Claude 還更好一些?
    msg7086
        9
    msg7086  
       Feb 14, 2025
    @TigerS Claude 质量普遍是更好的,cursor 默认就是用的 Sonnet ,唯一要担心的就是价格。
    Claude 3.5 Sonnet 是 3&15/M ,对比 Gemini 2.0 Flash Exp 是完全免费,就算用正价版的 Flash 也只有 0.1&0.4/M ,价格差距是 30 倍。要是要我自己掏钱,那我选便宜点的,顶多反复多问几次。
    TigerS
        10
    TigerS  
    OP
       Feb 14, 2025
    @msg7086 和一個嘗試過 Claude 的朋友聊了聊,他現在主要還是用 GPT ,他說如果單純說寫代碼 Claude 的確強大一些,但是如果用到數學模型,解決複雜的數學問題等等,Claude 就和 GPT 差別大了。

    他說了個比喻,GPT 對於他的問題,各類複雜數學模型和數學問題,(他是做量化交易的所以對於數學模型需求非常大) GPT 就像一個數學專業(甚至全科)的研究生,甚至有的時候 GPT 還能反駁你的一些想法,最後證明 GPT 是對的。而 Claude 在寫代碼上是本科水平,但數學專業及思路等問題上最多是個高中水平。

    不知道這樣比較對不對。
    msg7086
        11
    msg7086  
       Feb 16, 2025
    @TigerS 数学方面我就不清楚了。这种情况的话最好就是多个模型换着用。
    比如现在流行让 R1 专门负责思考,做一些规划上的东西,规划完了以后切到 sonnet 根据规划的文档去写实际代码。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1777 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 47ms · UTC 16:18 · PVG 00:18 · LAX 09:18 · JFK 12:18
    ♥ Do have faith in what you're doing.