近日,OpenAI 再次驚艷全球,重磅發(fā)布了全新的 AI 模型——o3。這次發(fā)布的的 o3 系列模型是 o1 的迭代版本,考慮到可能與英國電信運營商 O2 存在版權(quán)或商標(biāo)沖突,OpenAI 決定跳過「o2」命名,直接采用「o3」。
o3 系列包含兩款重磅模型:
OpenAI o3:旗艦版本,具備強(qiáng)大的性能表現(xiàn)
OpenAI o3 mini:輕量級模型,但能更快,更便宜,主打性價比
OpenAI聲稱,至少在某些條件下,o3模型可以接近實現(xiàn)AGI。
所謂AGI,即“通用人工智能”(artificial general intelligence)的縮寫,泛指能完成人類所能完成的任何任務(wù)的人工智能。OpenAI對此有著自己的定義:“在最具經(jīng)濟(jì)價值的工作上勝過人類的高度自主系統(tǒng)”。
按照OpenAI的說法,o3模型在ARC-AGI圖形邏輯推理基準(zhǔn)上獲得了破紀(jì)錄的分?jǐn)?shù),低計算場景中,o3得分為75.7%,而在高計算測試中,它達(dá)到了87.5%——超過了標(biāo)志著達(dá)到人類水平的門檻85%。作為對比,o1模型的得分僅在25%到32%之間。o3的表現(xiàn)幾乎是o1三倍。
根據(jù)openAI展示的內(nèi)容來看,目前可知的O3提升地方大概有幾處:
一是在軟件任務(wù)組成的基準(zhǔn)測試當(dāng)中,O3準(zhǔn)確率達(dá)到71.7%,比上一代提升了20% 以上;
二是在競賽代碼方面,O3得到的最高ELO 分?jǐn)?shù)是2727分,比O1高893分,還比openAI目前最厲害的競賽程序員和指導(dǎo)員高227分;
三是在數(shù)學(xué)競賽基準(zhǔn)測試中,O3的AIMI準(zhǔn)確率約為 96.7%,比O1提升了13.4%;
第四個,O3在在博士水平科學(xué)問題上測試,獲得的準(zhǔn)確率為87.7%,這是與人類博士水平基本一致的,比O1提升了近10%;
在rkg Pub上,O3是新的第一名。
OpenAI發(fā)布o(jì)3,再次突破 AI 極限,為全球 AI 的發(fā)展注入了新的活力。這一模型的問世,不僅預(yù)示著人工智能正逐漸走向成熟,還為我們展示了未來 AI 世界的無限可能。