最新Claude 3.5 Sonnet 免費試玩!

  • 你好人類! 我係最新Claude 3 Sonnet! 今日有咩可以幫到你?
思考中... ...

Anthropic 剛推出的Claude 3.5 Sonnet 是一個先進的人工智能語言模型,在多個測試中表現比Openai 的GPT 4o優異,以下是它在不同領域的表現:

  1. 研究生水平推理
    • Claude 3.5 Sonnet:59.4%(0-shot CoT)
    • GPT-4o:53.6%(0-shot CoT)
    • 比較結果:Claude 3.5 Sonnet 在高級推理任務中表現更優。
  2. 本科水平知識
    • Claude 3.5 Sonnet:88.7%(5-shot),88.3%(0-shot CoT)
    • GPT-4o:88.7%(0-shot CoT)
    • 比較結果:兩者在 0-shot CoT 下表現相同,但 Claude 3.5 Sonnet 在 5-shot 表現略勝一籌。
  3. 編程能力
    • Claude 3.5 Sonnet:92.0%(0-shot)
    • GPT-4o:90.2%(0-shot)
    • 比較結果:Claude 3.5 Sonnet 在編程理解和應用方面稍有優勢。
  4. 多語言數學
    • Claude 3.5 Sonnet:91.6%(0-shot CoT)
    • GPT-4o:90.5%(0-shot CoT)
    • 比較結果:Claude 3.5 Sonnet 在多語言數學問題上的表現略勝於 GPT-4o。
  5. 文本推理
    • Claude 3.5 Sonnet:87.1%(3-shot)
    • GPT-4o:83.4%(3-shot)
    • 比較結果:Claude 3.5 Sonnet 顯示出更強的文本理解和推理能力。
  6. 綜合評估
    • Claude 3.5 Sonnet:93.1%(3-shot CoT)
    • GPT-4o:未提供數據
    • 比較結果:由於缺乏 GPT-4o 的數據,無法直接比較,但 Claude 3.5 Sonnet 表現極為優異。
  7. 數學問題解決
    • Claude 3.5 Sonnet:71.1%(0-shot CoT)
    • GPT-4o:76.6%(0-shot CoT)
    • 比較結果:GPT-4o 在數學問題解決方面表現更佳。
  8. 小學數學
    • Claude 3.5 Sonnet:96.4%(0-shot CoT)
    • GPT-4o:未提供數據
    • 比較結果:Claude 3.5 Sonnet 表現優異,但無法與 GPT-4o 直接比較。

綜合來看,Claude 3.5 Sonnet 在多數測試中表現出色,尤其是在高級推理、文本推理和編程能力方面,相比 GPT-4o 更具優勢。

使用技巧
– 免VPN即開即用!
– 手機用戶可按聊天室右上角的正方型縮放聊天室以符合螢幕大小。

每星期免費25000個代幣!
即日起註冊成為我們的會員 (完全免費!) 每星期賞你25000個代幣免費使用呢個新MODEL! 如果唔夠用可以到商店購買額外代幣使用,20萬個代幣只要hk$50,而100萬個代幣更抵只要hk$160,用幾多買幾多無限期架!

若果有任何建議或查詢,都可以電郵或者係telegram 搵我地架!

Chat Icon