国产电影精品一区-日韩专区一区-亚洲小说欧美激情另类,亚洲精品在线观看视频,欧美性生交大片免费看app麻豆,久久99国产精品二区不卡

直追GPT-3.5,“歐洲版OpenAI”推出新模型,成立6個月估值20億美元 | 最前線

業界
TIME
2023-12-22 19:10
36氪
分享

  文|王怡寧

  編輯|鄧詠儀

  12月初,法國AI初創公司Mistral AI已正式結束其備受期待的A輪融資。據彭博社報道,公司已籌集了3.85億歐元(約4.15億美元),該公司的估值約為20億美元。Mistral AI今天也開放了其商業平臺。

  12月8日,Mistral AI的官方Twitter發布了他們賬號開通以來的第三條推文,沒有熱鬧盛大的發布會,也沒有讓人眼前一亮的宣傳視頻,僅僅是一條普通到不能再普通的磁力鏈接,就打破了AI開發者圈的平靜。

  △圖源:Twitter

  這條下載鏈接通向的正是近期震動AI圈的開源MoE模型——Mixtral8x7B。

  從名字來看,Mixtral8x7B就揭示了其架構:由8個70億參數組成的小模型組合,這也被稱為MoE(Mixture of Experts,混合專家)架構——指把復雜任務分成一系列更小且更容易處理的子任務,每個子任務都由一個特定領域的“專家”負責處理。MoE架構讓整體模型更多功能且強大。同樣這也是GPT-4采用的架構。

  從官方公布的數據來看,Mixtral8x7B在基準測試中的表現十分出色,跑分全面超越GPT-3.5,更在多個跑分上超過了Llama2 70B,并且推理速度還是后者的6倍。

  △圖源:Mistral AI

  在生成同等質量的模型時,Mixtral8x7B的推理過程消耗的成本也明顯低于Mistral AI,高能效優勢顯著。

  △圖源:Mistral AI

  此外,Mixtral8x7B還支持英語、法語、意大利語、德語和西班牙語五種語言,具備自然的編碼能力。

  開源、跑分優秀、高效……這一系列的優勢疊加起來,讓Mixtral8x7B有了趕超Chat-GPT的勢頭,這確實足以讓人感到興奮。

  一位開發者在Mistral MoE的基礎上做了微調,發布了dolphin-2.5-mixtral-8x7模型。這是一個完全未經審查的開源模型,這意味著它不會受開發者的道德觀影響,也不會回復“作為一個AI助手,我不能……”

  △圖源:Twitter

  而隨著Mixtral8x7B一起走入大眾視野的,還有它的開發者—來自法國的大模型公司Mistral AI,從名不見經傳到一舉成名,他們僅僅用了半年。

“歐洲版OpenAI”,成立僅半年估值20億美

  彭博社報道,公司已籌集了3.85億歐元(約4.15億美元),該公司的估值約為20億美元。

  而僅僅在6個月前,Mistral AI才完成1.05億歐元(約1.13億美元)的天使輪融資——也是歐洲歷史上最大的種子輪融資。Mistral AI僅僅用了7頁PPT,就吸引了包括Redpoint、Index Ventures在內的一眾歐洲老牌風投機構。事實上,這家頗受歐美兩地明星投資機構青睞的AI獨角獸公司,在今年5月才在法國巴黎正式成立。

  盡管成立時間不長,Mistral AI的三人創始團隊卻相當有分量,在多模態、RAG方向上都有著豐富經驗。公司CEO Arthur Mensch是前DeepMind研究科學家,主導了Chinchilla、Retro、Flamingo等重要論文的發表,而這三篇論文分別是20-22年間Google在LLM、RAG、多模態三個領域最重要的作品。

  首席科學家Guillaume Lample,也是前Meta研究科學家,與CTO Timothee Lacroix,都來自Llama核心團隊。目前,MistralAI的團隊僅有22名員工,保持著小而美的風格。

  △圖源:Mistral AI

不要大而全,強攻小模型

  在大語言模型當道的今天,Mistral AI卻反其道而行之,從成立之初就專注于研發「小模型」。聯合創始人兼CEO Arthur在與硅谷投資人Sarah Guo和Elad Gil的專訪中提到,讓模型變小一定會有助于Agents的開發和應用,小模型能夠有效降低使用成本,也能在更多設備上運行,從而讓更多有意思的應用有機會被構建。

  Mistral AI近期發布的聊天模型正是對這一理念的實踐。

  近期,Mistral AI剛剛發布了開放平臺La plateforme,并提供了mistral-tiny、mistral-small和mistral-medium三個基于指令生成文本的聊天模型,以及一個嵌入模型。

  其中,最受市場關注的還是目前仍在測試階段的“中杯”模型Mistral-medium。作為Mistral AI推出的最強開源模型,Mistral-medium在MT-Bench得分高達8.6,在主流測評中各項指標已優于GPT-3.5。

  △圖源:Mistral AI

  Mistral AI另一個特別之處在于,對開源路線的堅定選擇。

  事實上,在2020年前,大部分大模型的研究成果都是共享和透明的,直到一些公司開始加速商業化,閉源模型才越來越廣泛被使用。我們所熟知的OpenAI,最早就是作為一家開源的非盈利性組織創辦的,而后才轉為閉源公司,這也是曾經的投資者馬斯克對其相當不滿的點。

  如今,除了Meta的LLaMA系列以外,目前大部分頭部大模型廠商,如OpenAI、Google和微軟都選擇了閉源,但開源模型還是以能夠快速迭代、可定制性的特點受到歡迎。這也是Mistral被稱為“歐洲版OpenAI”的原因,在大公司紛紛閉源之際,也有人將Mistral AI稱為開源路線的希望。

  有趣的是,近日一張由ARK Invest團隊制作的趨勢圖預測了2024年開源社區與專有模型在生成式AI上的發展。據其預測,開源模型的性能在不斷提升,與專有模型之間的差距也將越來越小。對此,Meta首席AI科學家、圖靈獎獲得者Yann LeCun也轉發表示:

開源人工智能模型正走在超越專有模型的路上。

  △圖源:Twitter

  目前,Mixtral8×7B已經在不少開源模型平臺上線,而開源究竟能否趕超閉源,仍需時間驗證。

  歡迎交流

THE END
免責聲明:本文系轉載,版權歸原作者所有;刊載之目的為傳播更多信息,如內容不適請及時通知我們。

相關熱點

  聯合國教科文組織“全民科學開放”會議近日在日內瓦舉行。該會議作為教科文組織“基礎科學促進可持續發展國際年”的閉幕式,重點探討推動全球公平、開放科學的未來...
業界
  日前,數字人民幣App再度“上新”,在確保安全的基礎上,提供更加便捷的修改手機號、掛失解掛、重置密碼的服務。用戶只需要“一鍵操作”,就可以同步更換數字人民幣APP賬...
證券

相關推薦

1
3