文 | 周鑫雨
編輯 | 蘇建勛
在由ChatGPT引發的大模型熱潮中,不少國內的初創企業希望能走出一條中國化道路。
成立于2021年的瀾舟科技是由李開復的創新工場從0孵化的AI企業。據創始人周明介紹,瀾舟科技致力于解決人類的語言理解和生成難題,提供基于NLP(自然語言理解)技術的開源大模型以及聚焦于營銷、金融、文化創意等場景的功能引擎和應用。
2018年以來,BTA、華為等國內互聯網廠商在大模型的研發上已經開始涉獵。周明發現,互聯網企業的大模型主要服務于企業內部,鮮少對外賦能。研發大模型對中小企業來說有較高門檻,國內相關的AI服務較少,大多公司只能選擇接入海外的開源模型。
為此,瀾舟科技于2021年7月推出了孟子大模型及相關系列開源模型。基于Transformer,孟子大模型可支持以及快速替換自回歸(如GPT)、自編碼(如BERT)等多種預訓練模型。
在周明看來,初創公司在大模型領域依然有試探天花板的機會。基于網上的公開數據和合作伙伴提供的數據,瀾舟科技選擇在算法能力上下功夫,而非狂堆參數的“暴力”模式。
最終,瀾舟科技花了近一年的時間打磨出了孟子大模型。在模型榜單CLUE發布的中文理解評測排行榜中,孟子大模型分數突破84分,逼近人類基準分數(85.61分)。
目前,孟子大模型已開源17個模型,分別可應用于自然語言理解、金融資料分類、可控文本生成和圖片生成等場景。同時,瀾舟科技還為下游應用場景提供了句向量計算(用于捕捉文本間的語義相似性)和大模型定制的服務。
除此之外,面向營銷、金融、文化創意等場景,瀾舟科技推出了AIGC(智能創作平臺)、機器翻譯平臺、金融NLP平臺等toB+toC服務。目前,瀾舟科技已與華為云、傳神語聯網、中文在線等企業達成合作,并與北大、清華等10所高校進行產學研的聯璧。
目前瀾舟科技也在打磨不同規模的ChatGPT模型,從10億參數、100億元參數到1000億參數,適應不同需求。同時在大模型底座基礎上,也在考慮訓練垂直領域的大模型。瀾舟長期以來一直從事金融領域的大模型,最近與中文在線合作宣布,合作打造一款用于網文寫作的類ChatGPT模型。
瀾舟科技創始人周明于1999年加入微軟亞洲研究院并長期領導NLP研究,其團隊為微軟必應搜索、Office、Azure、微軟小冰等產品貢獻了核心的 NLP 技術。瀾舟科技三名合伙人在大數據、人工智能等領域均有較為豐富的從業或研究經驗。
“在國內開源語料稀缺的情況下,中文的數據量大概在英文的1/10,短期內,中文大模型追趕上ChatGPT有一定難度。”周明告訴36氪,“不過,只要AI大模型與上下游自上而下或自下而上形成一個良好的生態或閉環效應,國產的中文ChatGPT是可以期待的。”