文/林妍溱 | 2025-02-03發表
根據OpenAI提供的數據,在程式競賽測試(Codeforces)測試中,o3-mini-high表現高過前代模型。(圖片來源/OpenAI)
繼兩周前執行長Sam Altman預告,OpenAI上周宣布具推理能力的小型AI模型OpenAI o3-mini,已部署到ChatGPT及API供付費方案用戶及開發人員使用。
OpenAI是於去年12月新消息12連發中,公布最新一代具推理能力的旗艦模型o3,並預告o3-mini將是最先推出的同系列模型。
OpenAI指出,o3-mini保有OpenAI o1-mini的低成本及低延遲性,但進一步拓展小模型的效能及速度,具備優異的STEM(科學、數學和程式撰寫)能力。o1仍是OpenAI最主要的通用知識推理模型,但是在需要精準和速度的STEM領域o3-mini提供另類選擇。在ChatGPT中,o3-mini使用中等推理能力,兼顧速度和答案的精準性。
對開發人員而言,o3 mini也是OpenAI第一個提供高呼聲開發功能的小型模型,像是函式呼叫、結構式輸入及開發人員訊息等。和o1-mini相同,o3-mini也支援串流。開發人員有低、中、高三種推理能力,可以選擇用於不同使用場景。這種彈性讓o3-mini可以在解決複雜任務時更積極思考,或是在考量延遲性時優化速度。
根據OpenAI提供的數據,在AIME 2024數學標竿測試中,o3-mini-high推理能力等級模型得分在87.3,優於o1-preview的56.7及o1-mini的63.6。科學解題的GPQA Diamond測試中,o3-mini-high(79.7)也高於o1-preview(78.3)及o1-mini(60.0)。程式競賽測試(Codeforces)及軟體工程(SWE-bench Verified)測試中,o3-mini-high也都高過另二個前代模型。
圖片來源/OpenAI
o3-mini現在也能整合搜尋功能,可提供即時網頁答案及連結。OpenAI說致力於將搜尋整合至所有推理模型,o3-mini是早期原型。
不過目前o3並不支援視覺功能,需要的用戶還是得繼續使用o1-mini。
o3-mini現在已部署到ChatGPT及API。API部分,即日起o3-mini已經部署到API使用層級3到5特定開發人員的Chat Completions API、Assistants API及Batch API。
在ChatGPT部分,Plus、Team和Pro用戶現在就可以存取o3-mini,企業方案用戶2月可以開始使用。在模型選擇器中的o1-mini將由o3-mini取代,提供更高速限和更低延遲性。Plus和Team用戶每天互動訊息,由o1-mini的50則提高為o3-mini的150則。所有付費用戶都可以在模型選擇器,選擇回應時間耗時較久的o3-mini-high,Pro用戶則可以無上限選擇o3-mini及o3-mini-high。
免費方案用戶也可以試用o3-mini,方法是選擇訊息輸入列的「Reason」圖示。o3也是第一個提供給免費ChatGPT用戶的推理模型。
OpenAI指出,由於持續提升模型數理推理能力,和GPT-4相比,現在OpenAI的模型每字詞使用價格已降低95%,未來該公司會持續朝此發展。
OpenAI此舉顯然部分是回應橫空出世的中國新興開源模型DeepSeek。DeepSeek V3模型多項效能測試超越Meta Llama,令美國AI科技公司繃緊神經,加快研發及推出作業。
Line OA / 美容保養類
網站技術:PHP . Javascript/MySql
滿意寶寶LINE OA官方帳號,各位爸爸媽媽都有加入了嗎?! 只需要動動手指就可以知道官方帳號的最新資訊、商品與兌換商品。
網頁設計.企業形象網站 / 服務類
網站技術:PHP . Javascript
服務對象主要是台中當地不動產事務所,與各事務所建立互助的關係。公會不定期舉辦教育訓練/座談會、提供相關資料使用。加入會員可以觀看自己的報名紀錄與時數相關資料。
精選專案.網頁設計.RWD響應式網站.企業形象網站 / 休閒餐飲類
網站技術:PHP . Javascript/MySql
丹醇用最新鮮的原料製作最安心的商品,追求吃進身體裡面的食物與飲品都是健康、安全、無負擔。 網站主打線上訂購乳製品,簡易的下定流程,對於第一次使用的會員也不是問題,也能配合指定的時間抵達喔。
電話:(02)2739-9096 | 傳真:(02)2739-6637 | 客服:[email protected] | 臺北市信義區和平東路3段257號6樓map
© 2019 傑立資訊 All rights reserved.| 網站隱私政策