文|王怡寧
編輯|鄧詠儀
12月初,法國AI初創公司Mistral AI已正式結束其備受期待的A輪融資。據彭博社報道,公司已籌集了3.85億歐元(約4.15億美元),該公司的估值約為20億美元。Mistral AI今天也開放了其商業平臺。
12月8日,Mistral AI的官方Twitter發布了他們賬號開通以來的第三條推文,沒有熱鬧盛大的發布會,也沒有讓人眼前一亮的宣傳視頻,僅僅是一條普通到不能再普通的磁力鏈接,就打破了AI開發者圈的平靜。
△圖源:Twitter
這條下載鏈接通向的正是近期震動AI圈的開源MoE模型——Mixtral8x7B。
從名字來看,Mixtral8x7B就揭示了其架構:由8個70億參數組成的小模型組合,這也被稱為MoE(Mixture of Experts,混合專家)架構——指把復雜任務分成一系列更小且更容易處理的子任務,每個子任務都由一個特定領域的“專家”負責處理。MoE架構讓整體模型更多功能且強大。同樣這也是GPT-4采用的架構。
從官方公布的數據來看,Mixtral8x7B在基準測試中的表現十分出色,跑分全面超越GPT-3.5,更在多個跑分上超過了Llama2 70B,并且推理速度還是后者的6倍。
△圖源:Mistral AI
在生成同等質量的模型時,Mixtral8x7B的推理過程消耗的成本也明顯低于Mistral AI,高能效優勢顯著。
△圖源:Mistral AI
此外,Mixtral8x7B還支持英語、法語、意大利語、德語和西班牙語五種語言,具備自然的編碼能力。
開源、跑分優秀、高效……這一系列的優勢疊加起來,讓Mixtral8x7B有了趕超Chat-GPT的勢頭,這確實足以讓人感到興奮。
一位開發者在Mistral MoE的基礎上做了微調,發布了dolphin-2.5-mixtral-8x7模型。這是一個完全未經審查的開源模型,這意味著它不會受開發者的道德觀影響,也不會回復“作為一個AI助手,我不能……”
△圖源:Twitter
而隨著Mixtral8x7B一起走入大眾視野的,還有它的開發者—來自法國的大模型公司Mistral AI,從名不見經傳到一舉成名,他們僅僅用了半年。
“歐洲版OpenAI”,成立僅半年估值20億美
彭博社報道,公司已籌集了3.85億歐元(約4.15億美元),該公司的估值約為20億美元。
而僅僅在6個月前,Mistral AI才完成1.05億歐元(約1.13億美元)的天使輪融資——也是歐洲歷史上最大的種子輪融資。Mistral AI僅僅用了7頁PPT,就吸引了包括Redpoint、Index Ventures在內的一眾歐洲老牌風投機構。事實上,這家頗受歐美兩地明星投資機構青睞的AI獨角獸公司,在今年5月才在法國巴黎正式成立。
盡管成立時間不長,Mistral AI的三人創始團隊卻相當有分量,在多模態、RAG方向上都有著豐富經驗。公司CEO Arthur Mensch是前DeepMind研究科學家,主導了Chinchilla、Retro、Flamingo等重要論文的發表,而這三篇論文分別是20-22年間Google在LLM、RAG、多模態三個領域最重要的作品。
首席科學家Guillaume Lample,也是前Meta研究科學家,與CTO Timothee Lacroix,都來自Llama核心團隊。目前,MistralAI的團隊僅有22名員工,保持著小而美的風格。
△圖源:Mistral AI
不要大而全,強攻小模型
在大語言模型當道的今天,Mistral AI卻反其道而行之,從成立之初就專注于研發「小模型」。聯合創始人兼CEO Arthur在與硅谷投資人Sarah Guo和Elad Gil的專訪中提到,讓模型變小一定會有助于Agents的開發和應用,小模型能夠有效降低使用成本,也能在更多設備上運行,從而讓更多有意思的應用有機會被構建。
Mistral AI近期發布的聊天模型正是對這一理念的實踐。
近期,Mistral AI剛剛發布了開放平臺La plateforme,并提供了mistral-tiny、mistral-small和mistral-medium三個基于指令生成文本的聊天模型,以及一個嵌入模型。
其中,最受市場關注的還是目前仍在測試階段的“中杯”模型Mistral-medium。作為Mistral AI推出的最強開源模型,Mistral-medium在MT-Bench得分高達8.6,在主流測評中各項指標已優于GPT-3.5。
△圖源:Mistral AI
Mistral AI另一個特別之處在于,對開源路線的堅定選擇。
事實上,在2020年前,大部分大模型的研究成果都是共享和透明的,直到一些公司開始加速商業化,閉源模型才越來越廣泛被使用。我們所熟知的OpenAI,最早就是作為一家開源的非盈利性組織創辦的,而后才轉為閉源公司,這也是曾經的投資者馬斯克對其相當不滿的點。
如今,除了Meta的LLaMA系列以外,目前大部分頭部大模型廠商,如OpenAI、Google和微軟都選擇了閉源,但開源模型還是以能夠快速迭代、可定制性的特點受到歡迎。這也是Mistral被稱為“歐洲版OpenAI”的原因,在大公司紛紛閉源之際,也有人將Mistral AI稱為開源路線的希望。
有趣的是,近日一張由ARK Invest團隊制作的趨勢圖預測了2024年開源社區與專有模型在生成式AI上的發展。據其預測,開源模型的性能在不斷提升,與專有模型之間的差距也將越來越小。對此,Meta首席AI科學家、圖靈獎獲得者Yann LeCun也轉發表示:
開源人工智能模型正走在超越專有模型的路上。
△圖源:Twitter
目前,Mixtral8×7B已經在不少開源模型平臺上線,而開源究竟能否趕超閉源,仍需時間驗證。
歡迎交流