來源:華爾街見聞
在人工智能的歷史上,2024年9月12日或許將被銘記為一個歷史性轉折點。就在這一天,OpenAI宣布了其最新系列AI模型——o1。據官方稱,o1是史上最聰明的模型,思考方式也更接近人類,標志著人類正在通往推理時代的新道路。
o1模型的核心在于其推理能力。與基于預測的模型不同,o1在回答問題之前會進行深入的思考,探索不同的路徑直到找到最佳答案。
這種能力使得o1能夠在給定更多的“思考”時間時,回答更難的問題,類似于在國際象棋比賽中關鍵時刻考慮可能的走法。這種推理能力是AI發展的一大步,它使得AI能夠在更廣泛的領域中應用,包括但不限于編程、數學和科學問題。
普通用戶在日常使用中可能難以察覺o1模型與GPT系列之間的微妙差異,但對于深入研究AI技術的研究人員而言,這一變化卻是革命性的。
據《The Atlantic》上周文章,研究人員已經認識到,與GPT等舊模型相比,o1模型不僅僅是一次簡單的升級,而是標志著一個“完全不同的游戲規則”和“真正的進步”。作為第一個具備真正通用推理能力的大模型,o1模型在處理復雜問題和推理任務時展現出的能力,或預示著人工智能技術的一個歷史性轉折點。
OpenAI研究副總裁Mark Chen今年早前指出,o1與標準 ChatGPT 有著根本的不同,因為它可以“推理”,這是人類智能的標志。此后不久,OpenAI首席執行官Altman宣布“智能時代即將到來”,人工智能將幫助人類解決氣候問題并殖民太空。上周,這家初創公司向公眾發布了具有完全成熟推理能力的o1完整的第一代版本。
第一個具備真正通用推理能力的大模型
OpenAI稱,o1模型是第一個具備真正通用推理能力的大模型,這一點在測試化學、物理和生物學專業知識的基準GPQA-diamond上得到了充分體現。
根據OpenAI的評估,o1在該測試中全面超過了人類博士專家,準確率達到78.3%,而人類專家的得分為69.7%。OpenAI稱,“通用人工智能(AGI)之路,已經沒有任何阻礙”。
此外,o1在多個高難度的推理基準測試中表現優異,例如在美國數學邀請賽(AIME)中,o1的正確率達到了83.3%,遠超其前身GPT-4o的表現。
o1模型的推出,也使得國內外的AI企業開始密切關注彼此的動態,意圖在AI大模型領域實現突破。市場涌現出一批新興的大模型,如kimi的k0math、Deepseek的DeepSeek-R1-Lite和昆侖萬維的“天工大模型4.0”o1版,它們在邏輯思維與深度推理的能力上,試圖與o1抗衡。
風險提示及免責條款
市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。
還沒有評論,來說兩句吧...