1月23日晚,OpenAI宣布推出最新AI Agent工具Operator。OpenAI表示Operator可以自動執行預訂旅行住宿、預訂餐廳和在線購物等任務。用戶可以在Operator界面中選擇多個任務類別,包括購物、送貨、餐飲和旅行。
據悉,在核心功能與創新方面,Operator依托全新的Computer-Using Agent(CUA)模型,結合GPT-4o的視覺能力與強化學習驅動的推理能力,能與圖形用戶界面(GUI)交互,可實現表單填寫、訂購雜貨、制作表情包等任務自動化處理,無需定制API,極大擴展了AI應用范圍。用戶能在Operator界面選擇購物、送貨、餐飲和旅行等多個任務類別,還可個性化工作流,如設置網站偏好或保存常用提示。
此外,Operator在WebArena和WebVoyager等關鍵瀏覽器交互測試中取得行業標桿成績,但在創建幻燈片或管理日歷等復雜任務上存在一定局限。
在隱私與安全保障方面,OpenAI強調Operator在隱私與安全設計上有三層防護。
一是用戶優先控制,在處理登錄憑據等時采用接管模式,重要操作需用戶確認,還拒絕處理高風險任務。
二是數據管理透明,用戶可關閉相關選項確保數據不用于模型訓練,還能一鍵清除瀏覽數據等。
三是對抗惡意行為,可檢測并忽略提示注入等行為,有專屬監控模型和人工審查系統監測潛在威脅。
不過,OpenAI也承認該系統仍存在錯誤或濫用風險,將持續優化。
下一步,OpenAI計劃將支持Operator的CUA模型開放至API,方便開發者構建自定義AI代理工具。同時,持續提升Operator執行更復雜任務的能力,未來會向Plus、Team和Enterprise用戶開放,并逐步整合至ChatGPT,支持實時和異步任務處理。
此外,OpenAI正與DoorDash、Instacart、Uber等企業合作,探索電商、物流等領域應用,例如與加州斯托克頓市(City of Stockton)協作,簡化市民注冊服務的流程。
目前,Operator處于預覽版狀態,僅提供給美國Pro用戶使用,很快會擴大應用范圍。