近日,斯坦福大學(xué)AI研究團隊的Llama3-V開源模型因抄襲指控被推上風(fēng)口浪尖。該模型被指涉嫌抄襲清華系明星創(chuàng)業(yè)公司面壁智能開發(fā)的開源模型“小鋼炮”MiniCPM-Llama3-V2.5,這一事件迅速在網(wǎng)絡(luò)上引發(fā)廣泛關(guān)注和熱議。
事件的起因在于,斯坦福AI團隊在5月29日公開宣布,他們研發(fā)出了只需500美元就能訓(xùn)練出超越GPT-4V性能的SOTA多模態(tài)大模型——Llama3-V。然而,不久后,網(wǎng)友便發(fā)現(xiàn)該模型的結(jié)構(gòu)和代碼與面壁智能的“小鋼炮”模型存在高度相似性,除了部分變量名外,幾乎完全一致。
6月2日晚,面壁智能團隊確認了這一抄襲事實。他們指出,斯坦福的Llama3-V模型不僅能夠識別出“清華簡”中的戰(zhàn)國古文字,而且連錯誤的識別結(jié)果都與他們的MiniCPM模型一致。這些古文字數(shù)據(jù)是面壁智能團隊花費數(shù)月時間從清華簡上逐字掃描并人工標注的,且從未公開過。
面對抄襲指控,斯坦福Llama3-V團隊的兩位主要作者Siddharth Sharma和Aksh Garg在社交平臺X上向面壁智能團隊和公眾道歉。他們承認了自己的錯誤,并承諾將撤下所有Llama3-V模型。這一道歉信在發(fā)布后不久被刪除,但隨后他們再次發(fā)布了類似內(nèi)容的道歉信,表明了他們對此次事件的重視和決心。