8月31日凌晨,備受行業矚目的首批大模型產品獲批名單終于出爐。其中,百度、字節、商湯、中科院旗下紫東太初、百川智能、智譜華章等8個企業/機構的大模型位列第一批名單,可正式上線面向公眾提供服務。值得一提的是,阿里通義千問、360智腦、訊飛星火等均不在首批獲批名單中。
附8家AI大模型簡介和鏈接:
1.百度(文心一言)
https://wenxin.baidu.com
文心一言是百度全新一代知識增強大語言模型,文心大模型家族的新成員,能夠與人對話互動,回答問題,協助創作,高效便捷地幫助人們獲取信息、知識和靈感。2023年3月16日,百度正式發布大語言模型、生成式AI產品“文心一言”。6月,百度文心大模型3.5版本已內測可用。8月31日,文心一言率先向全社會全面開放。
2.抖音(云雀大模型)
https://www.doubao.com
云雀大模型是字節跳動旗下抖音研發的一款大模型產品。2023年8 月,其開發的 AI 機器人 “豆包” 開始小范圍邀請測試。用戶可通過手機號、抖音或者 Apple ID 登錄?!岸拱?提供聊天機器人、寫作助手以及英語學習助手等功能,它可以回答各種問題并進行對話,幫助人們獲取信息。8月31日,字節的云雀大模型成為首批上線的8家大模型之一。
3.智譜AI(GLM大模型)
https://chatglm.cn
智譜AI是由清華大學計算機系技術成果轉化而來的公司,致力于打造新一代認知智能通用模型。公司合作研發了雙語千億級超大規模預訓練模型GLM-130B,并構建了高精度通用知識圖譜,形成數據與知識雙輪驅動的認知引擎,基于此模型打造了ChatGLM(chatglm.cn)。8 月 31 日,智譜華章正式上線首款生成式 AI 助手 —— “智譜清言”,現已在各大應用商店上線。該助手基于智譜 AI 自主研發的中英雙語對話模型 ChatGLM2,經過萬億字符的文本與代碼預訓練,并采用有監督微調技術,以通用對話的形式為用戶提供智能化服務?!爸亲V清言” 作為用戶的智能助手,可在工作、學習和日常生活中為用戶解答各類問題,完成各種任務。目前,“智譜清言” 已具備 “通用問答、多輪對話、創意寫作、代碼生成以及虛擬對話” 等豐富能力,未來還將開放多模態等生成能力。
4.中科院(紫東太初大模型)
https://xihe.mindspore.cn
紫東太初,是中國科學院自動化研究所研發的跨模態通用人工智能平臺。2021年7月9日,2021世界人工智能大會(WAIC)昇騰人工智能高峰論壇上,中國科學院自動化研究所所長徐波正式報告了跨模態通用人工智能平臺。2023年6月16日,中國科學院自動化研究所發布紫東太初2.0。目前,“紫東太初” 將于 9 月 1 日面向公眾開放服務。
5.百川智能(百川大模型)
https://www.baichuan-ai.com/
百川大模型是百川智能推出的大模型產品,其融合了意圖理解、信息檢索以及強化學習技術,結合有監督微調與人類意圖對齊,在知識問答、文本創作領域表現突出。成立僅四個月,百川智能便相繼發布了三款通用大語言模型。百川智能稱,截至今日,Baichuan-7B/13B 兩款開源模型在 Huggingface 下載量已突破三百萬。
6.商湯(日日新大模型)
https://www.sensetime.com/
日日新大模型是商湯科技宣布推出的大模型體系,包括自然語言處理模型“商量”(SenseChat)、文生圖模型“秒畫”和數字人視頻生成平臺“如影”(SenseAvatar)等。2023年4月,商湯科技董事長兼首席執行官徐立宣布推出“日日新SenseNova”大模型體系。8 月 31 日商湯大模型應用“商量 SenseChat” 宣布即日起全面向廣大用戶開放服務
7.MiniMax(ABAB大模型)
https://api.minimax.chat
ABAB大模型,是一款先進的通用大語言模型,具有強大的語言處理能力,能夠理解和生成自然語言文本,由Minimax自研推出。據了解,MiniMax 由前商湯科技副總裁、通用智能技術負責人閆俊杰于 2021 年 12 月創立,號稱 All in AGI。2023年3 月,MiniMax 推出面向企業用戶的 API 開放平臺,支持文本和語音模型的服務調用。同一時間,MiniMax 另一款生成式對話 AI“ Inspo” 開啟內測,具體能力包括寫作、獲取信息、提供建議,并且可以記住前文,能完成連續任務。
8.上海人工智能實驗室(書生通用大模型)
https://intern-ai.org.cn
書生通用大模型是上海人工智能實驗室研制的大模型。2021年,浦江實驗室聯合商湯、香港中文大學、上海交通大學發布通用視覺技術體系“書生”(INTERN)。如今,書生大模型體系參數已達千億級別,包括“書生·多模態”、“書生·浦語”和“書生·天際”等三大基礎模型,以及面向大模型研發與應用的開源體系。