OpenAI o3宣布:這就是ChatGPT的未來

雖然Google剛發布了 Gemini 2.0 Flash Thinking 模型,但 OpenAI 卻推出了 O3 進行反擊,這是一款能夠比以往更深入推理的人工智慧系統。

人工智慧世界中的戰鬥正在激烈進行。就在Google宣布推出 Gemini 2.0 Flash Thinking 模型 24 小時後,OpenAI 憑藉全新的 o3 進行反擊。

為了走得更遠

繼任者(OpenAI 避免使用 o2 這個名稱,以避免與英國電信業者發生任何衝突)顯示出令人印象深刻的表現。

賽龍OpenAI,o3 在 ARC-AGI 測試中的表現比其前身好三倍,旨在評估人工智慧模型推理特別複雜的數學和邏輯問題的能力的基準。

真正讓 o3 與眾不同的是他們在提供答案之前「反思」問題的能力。與幾乎立即回應的傳統模型不同,o3 花時間徹底分析所提出的問題,特別是那些需要逐步邏輯推理的問題。

OpenAI o3 在 ARC-AGI 基準測試中的結果

與 o1 不同,o3 允許您在三個層次的思考時間之間進行選擇:低、中、高。正如您可以想像的那樣,在低級別上,任務運行得更快,但可能容易出現不準確的情況,而在高級別上,情況恰恰相反:速度較慢,但更準確。

OpenAI 執行長 Sam Altman 解釋道:「我們認為這是人工智慧下一階段的開始,這些模型將能夠執行需要深度推理的日益複雜的任務」。當我們檢查模型在程式設計和解決高級科學問題方面的表現時,這種說法是有意義的。

深思熟慮的對齊,kézako?

OpenAI 還有公告一、安全技術:深思熟慮的對齊。

這種方法涉及使用精確的安全限制來訓練模型,使其能夠分析請求的性質及其自身的回應,以檢測可能違反其護欄的情況。這個想法是為了讓模型更能抵抗劫持企圖。

o3,什麼時候?

目前,o3 無法存取。 OpenAI計劃實施請求系統允許外部測試人員使用新模型。

聊天GPT


每週三在 Twitch 上與您見面,下午 5 點至晚上 7 點,關注直播展覽 SURVOLTÉS由 Frandroid 製作。電動車、電動自行車、專家建議、遊戲或感言,總有一款適合您!