OpenAI的巨變如此悄悄的來了，AI大模型開啟推理新時代

石向笛 2024-12-09 社會科技 97 次瀏覽 0個評論

　　來源：華爾街見聞

　　在人工智能的歷史上，2024年9月12日或許將被銘記為一個歷史性轉折點。就在這一天，OpenAI宣布了其最新系列AI模型——o1。據官方稱，o1是史上最聰明的模型，思考方式也更接近人類，標志著人類正在通往推理時代的新道路。

　　o1模型的核心在于其推理能力。與基于預測的模型不同，o1在回答問題之前會進行深入的思考，探索不同的路徑直到找到最佳答案。

　　這種能力使得o1能夠在給定更多的“思考”時間時，回答更難的問題，類似于在國際象棋比賽中關鍵時刻考慮可能的走法。這種推理能力是AI發展的一大步，它使得AI能夠在更廣泛的領域中應用，包括但不限于編程、數學和科學問題。

　　普通用戶在日常使用中可能難以察覺o1模型與GPT系列之間的微妙差異，但對于深入研究AI技術的研究人員而言，這一變化卻是革命性的。

　　據《The Atlantic》上周文章，研究人員已經認識到，與GPT等舊模型相比，o1模型不僅僅是一次簡單的升級，而是標志著一個“完全不同的游戲規則”和“真正的進步”。作為第一個具備真正通用推理能力的大模型，o1模型在處理復雜問題和推理任務時展現出的能力，或預示著人工智能技術的一個歷史性轉折點。

　　OpenAI研究副總裁Mark Chen今年早前指出，o1與標準 ChatGPT 有著根本的不同，因為它可以“推理”，這是人類智能的標志。此后不久，OpenAI首席執行官Altman宣布“智能時代即將到來”，人工智能將幫助人類解決氣候問題并殖民太空。上周，這家初創公司向公眾發布了具有完全成熟推理能力的o1完整的第一代版本。

　　第一個具備真正通用推理能力的大模型

　　OpenAI稱，o1模型是第一個具備真正通用推理能力的大模型，這一點在測試化學、物理和生物學專業知識的基準GPQA-diamond上得到了充分體現。

　　根據OpenAI的評估，o1在該測試中全面超過了人類博士專家，準確率達到78.3%，而人類專家的得分為69.7%。OpenAI稱，“通用人工智能（AGI）之路，已經沒有任何阻礙”。

　　此外，o1在多個高難度的推理基準測試中表現優異，例如在美國數學邀請賽（AIME）中，o1的正確率達到了83.3%，遠超其前身GPT-4o的表現。

　　o1模型的推出，也使得國內外的AI企業開始密切關注彼此的動態，意圖在AI大模型領域實現突破。市場涌現出一批新興的大模型，如kimi的k0math、Deepseek的DeepSeek-R1-Lite和昆侖萬維的“天工大模型4.0”o1版，它們在邏輯思維與深度推理的能力上，試圖與o1抗衡。

　　風險提示及免責條款

　　市場有風險，投資需謹慎。本文不構成個人投資建議，也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資，責任自負。

你可能想看：

OpenAI向公眾開放AI視頻生成工具Sora

周鴻祎呼吁全員使用AI，一起抓住大模型時代的創新機會

IFF發布《全球AI競爭力指數報告》：全球AI企業競爭格局與趨勢深度洞察

百融云創陳立宇：外呼工作很容易被AI替代，AI已能在市場波動時安撫客戶