直追GPT-3.5，“歐洲版OpenAI”推出新模型，成立6個月估值20億美元 | 最前線

業界

TIME

2023-12-22 19:10

36氪

　　文｜王怡寧

　　編輯｜鄧詠儀

　　12月初，法國AI初創公司Mistral AI已正式結束其備受期待的A輪融資。據彭博社報道，公司已籌集了3.85億歐元（約4.15億美元），該公司的估值約為20億美元。Mistral AI今天也開放了其商業平臺。

　　12月8日，Mistral AI的官方Twitter發布了他們賬號開通以來的第三條推文，沒有熱鬧盛大的發布會，也沒有讓人眼前一亮的宣傳視頻，僅僅是一條普通到不能再普通的磁力鏈接，就打破了AI開發者圈的平靜。

　　△圖源：Twitter

　　這條下載鏈接通向的正是近期震動AI圈的開源MoE模型——Mixtral8x7B。

　　從名字來看，Mixtral8x7B就揭示了其架構：由8個70億參數組成的小模型組合，這也被稱為MoE（Mixture of Experts，混合專家）架構——指把復雜任務分成一系列更小且更容易處理的子任務，每個子任務都由一個特定領域的“專家”負責處理。MoE架構讓整體模型更多功能且強大。同樣這也是GPT-4采用的架構。

　　從官方公布的數據來看，Mixtral8x7B在基準測試中的表現十分出色，跑分全面超越GPT-3.5，更在多個跑分上超過了Llama2 70B，并且推理速度還是后者的6倍。

　　△圖源：Mistral AI

　　在生成同等質量的模型時，Mixtral8x7B的推理過程消耗的成本也明顯低于Mistral AI，高能效優勢顯著。

　　△圖源：Mistral AI

　　此外，Mixtral8x7B還支持英語、法語、意大利語、德語和西班牙語五種語言，具備自然的編碼能力。

　　開源、跑分優秀、高效……這一系列的優勢疊加起來，讓Mixtral8x7B有了趕超Chat-GPT的勢頭，這確實足以讓人感到興奮。

　　一位開發者在Mistral MoE的基礎上做了微調，發布了dolphin-2.5-mixtral-8x7模型。這是一個完全未經審查的開源模型，這意味著它不會受開發者的道德觀影響，也不會回復“作為一個AI助手，我不能……”

　　△圖源：Twitter

　　而隨著Mixtral8x7B一起走入大眾視野的，還有它的開發者—來自法國的大模型公司Mistral AI，從名不見經傳到一舉成名，他們僅僅用了半年。

“歐洲版OpenAI”，成立僅半年估值20億美

　　彭博社報道，公司已籌集了3.85億歐元（約4.15億美元），該公司的估值約為20億美元。

　　而僅僅在6個月前，Mistral AI才完成1.05億歐元(約1.13億美元)的天使輪融資——也是歐洲歷史上最大的種子輪融資。Mistral AI僅僅用了7頁PPT，就吸引了包括Redpoint、Index Ventures在內的一眾歐洲老牌風投機構。事實上，這家頗受歐美兩地明星投資機構青睞的AI獨角獸公司，在今年5月才在法國巴黎正式成立。

　　盡管成立時間不長，Mistral AI的三人創始團隊卻相當有分量，在多模態、RAG方向上都有著豐富經驗。公司CEO Arthur Mensch是前DeepMind研究科學家，主導了Chinchilla、Retro、Flamingo等重要論文的發表，而這三篇論文分別是20-22年間Google在LLM、RAG、多模態三個領域最重要的作品。

　　首席科學家Guillaume Lample，也是前Meta研究科學家，與CTO Timothee Lacroix，都來自Llama核心團隊。目前，MistralAI的團隊僅有22名員工，保持著小而美的風格。

　　△圖源：Mistral AI

不要大而全，強攻小模型

　　在大語言模型當道的今天，Mistral AI卻反其道而行之，從成立之初就專注于研發「小模型」。聯合創始人兼CEO Arthur在與硅谷投資人Sarah Guo和Elad Gil的專訪中提到，讓模型變小一定會有助于Agents的開發和應用，小模型能夠有效降低使用成本，也能在更多設備上運行，從而讓更多有意思的應用有機會被構建。

　　Mistral AI近期發布的聊天模型正是對這一理念的實踐。

　　近期，Mistral AI剛剛發布了開放平臺La plateforme，并提供了mistral-tiny、mistral-small和mistral-medium三個基于指令生成文本的聊天模型，以及一個嵌入模型。

　　其中，最受市場關注的還是目前仍在測試階段的“中杯”模型Mistral-medium。作為Mistral AI推出的最強開源模型，Mistral-medium在MT-Bench得分高達8.6，在主流測評中各項指標已優于GPT-3.5。

　　△圖源：Mistral AI

　　Mistral AI另一個特別之處在于，對開源路線的堅定選擇。

　　事實上，在2020年前，大部分大模型的研究成果都是共享和透明的，直到一些公司開始加速商業化，閉源模型才越來越廣泛被使用。我們所熟知的OpenAI，最早就是作為一家開源的非盈利性組織創辦的，而后才轉為閉源公司，這也是曾經的投資者馬斯克對其相當不滿的點。

　　如今，除了Meta的LLaMA系列以外，目前大部分頭部大模型廠商，如OpenAI、Google和微軟都選擇了閉源，但開源模型還是以能夠快速迭代、可定制性的特點受到歡迎。這也是Mistral被稱為“歐洲版OpenAI”的原因，在大公司紛紛閉源之際，也有人將Mistral AI稱為開源路線的希望。

　　有趣的是，近日一張由ARK Invest團隊制作的趨勢圖預測了2024年開源社區與專有模型在生成式AI上的發展。據其預測，開源模型的性能在不斷提升，與專有模型之間的差距也將越來越小。對此，Meta首席AI科學家、圖靈獎獲得者Yann LeCun也轉發表示：

開源人工智能模型正走在超越專有模型的路上。

　　△圖源：Twitter

　　目前，Mixtral8×7B已經在不少開源模型平臺上線，而開源究竟能否趕超閉源，仍需時間驗證。

　　歡迎交流

THE END

免責聲明：本文系轉載，版權歸原作者所有；刊載之目的為傳播更多信息，如內容不適請及時通知我們。

国产电影精品一区-日韩专区一区-亚洲小说欧美激情另类,亚洲精品在线观看视频,欧美性生交大片免费看app麻豆,久久99国产精品二区不卡

直追GPT-3.5，“歐洲版OpenAI”推出新模型，成立6個月估值20億美元 | 最前線

相關熱點

最新文章

相關推薦

東京奧運會中國第13金由游泳健將張雨霏斬獲，一天斬獲兩枚金牌

兩名航天員成功出艙航天員劉伯明成功開啟天和核心艙節點艙出艙艙門

微信顯示“正在輸入”，其實不是在回復消息，背后原因挺“傷人”

關注我們

国产电影精品一区-日韩专区一区-亚洲小说欧美激情另类,亚洲精品在线观看视频,欧美性生交大片免费看app麻豆,久久99国产精品二区不卡

直追GPT-3.5，“歐洲版OpenAI”推出新模型，成立6個月估值20億美元 | 最前線

相關熱點

最新文章

相關推薦

東京奧運會中國第13金由游泳健將張雨霏斬獲，一天斬獲兩枚金牌

兩名航天員成功出艙 航天員劉伯明成功開啟天和核心艙節點艙出艙艙門

微信顯示“正在輸入”，其實不是在回復消息，背后原因挺“傷人”

關注我們

兩名航天員成功出艙航天員劉伯明成功開啟天和核心艙節點艙出艙艙門