OpenAI推出o3模型系列，AGI測試能力暴漲

TIME

2024-12-23 12:02

科技在線

　　近日，OpenAI 再次驚艷全球，重磅發(fā)布了全新的 AI 模型——o3。這次發(fā)布的的 o3 系列模型是 o1 的迭代版本，考慮到可能與英國電信運營商 O2 存在版權(quán)或商標(biāo)沖突，OpenAI 決定跳過「o2」命名，直接采用「o3」。

　　o3 系列包含兩款重磅模型：

　　OpenAI o3：旗艦版本，具備強(qiáng)大的性能表現(xiàn)

　　OpenAI o3 mini：輕量級模型，但能更快，更便宜，主打性價比

　　OpenAI聲稱，至少在某些條件下，o3模型可以接近實現(xiàn)AGI。

　　所謂AGI，即“通用人工智能”(artificial general intelligence)的縮寫，泛指能完成人類所能完成的任何任務(wù)的人工智能。OpenAI對此有著自己的定義：“在最具經(jīng)濟(jì)價值的工作上勝過人類的高度自主系統(tǒng)”。

　　按照OpenAI的說法，o3模型在ARC-AGI圖形邏輯推理基準(zhǔn)上獲得了破紀(jì)錄的分?jǐn)?shù)，低計算場景中，o3得分為75.7%，而在高計算測試中，它達(dá)到了87.5%——超過了標(biāo)志著達(dá)到人類水平的門檻85%。作為對比，o1模型的得分僅在25%到32%之間。o3的表現(xiàn)幾乎是o1三倍。

　　根據(jù)openAI展示的內(nèi)容來看，目前可知的O3提升地方大概有幾處：

　　一是在軟件任務(wù)組成的基準(zhǔn)測試當(dāng)中，O3準(zhǔn)確率達(dá)到71.7%，比上一代提升了20% 以上；

　　二是在競賽代碼方面，O3得到的最高ELO 分?jǐn)?shù)是2727分，比O1高893分，還比openAI目前最厲害的競賽程序員和指導(dǎo)員高227分；

　　三是在數(shù)學(xué)競賽基準(zhǔn)測試中，O3的AIMI準(zhǔn)確率約為 96.7%，比O1提升了13.4%；

　　第四個，O3在在博士水平科學(xué)問題上測試，獲得的準(zhǔn)確率為87.7%，這是與人類博士水平基本一致的，比O1提升了近10%；

　　在rkg Pub上，O3是新的第一名。

　　OpenAI發(fā)布o(jì)3，再次突破 AI 極限，為全球 AI 的發(fā)展注入了新的活力。這一模型的問世，不僅預(yù)示著人工智能正逐漸走向成熟，還為我們展示了未來 AI 世界的無限可能。

THE END

免責(zé)聲明：本文系轉(zhuǎn)載，版權(quán)歸原作者所有；刊載之目的為傳播更多信息，如內(nèi)容不適請及時通知我們。

国产电影精品一区-日韩专区一区-亚洲小说欧美激情另类,亚洲精品在线观看视频,欧美性生交大片免费看app麻豆,久久99国产精品二区不卡

OpenAI推出o3模型系列，AGI測試能力暴漲

相關(guān)熱點

最新文章

相關(guān)推薦

東京奧運會中國第13金由游泳健將張雨霏斬獲，一天斬獲兩枚金牌

兩名航天員成功出艙航天員劉伯明成功開啟天和核心艙節(jié)點艙出艙艙門

微信顯示“正在輸入”，其實不是在回復(fù)消息，背后原因挺“傷人”

關(guān)注我們

国产电影精品一区-日韩专区一区-亚洲小说欧美激情另类,亚洲精品在线观看视频,欧美性生交大片免费看app麻豆,久久99国产精品二区不卡

OpenAI推出o3模型系列，AGI測試能力暴漲

相關(guān)熱點

最新文章

相關(guān)推薦

東京奧運會中國第13金由游泳健將張雨霏斬獲，一天斬獲兩枚金牌

兩名航天員成功出艙 航天員劉伯明成功開啟天和核心艙節(jié)點艙出艙艙門

微信顯示“正在輸入”，其實不是在回復(fù)消息，背后原因挺“傷人”

關(guān)注我們

OpenAI推出o3模型系列，AGI測試能力暴漲

東京奧運會中國第13金由游泳健將張雨霏斬獲，一天斬獲兩枚金牌

兩名航天員成功出艙航天員劉伯明成功開啟天和核心艙節(jié)點艙出艙艙門

微信顯示“正在輸入”，其實不是在回復(fù)消息，背后原因挺“傷人”