IT之家 8 月 30 日消息,阿聯酋團隊日前公布了一個名為Jais 的阿拉伯語 AI 大模型,該模型由一群工程師、研究人員和一家硅谷芯片公司合作開發。
據介紹,Jais 大型語言模型包含 130 億個參數,這些參數由大量阿拉伯語和英語相結合的數據組成,其中一部分來自計算機代碼。
該模型在總部位于硅谷的 Cerebras Systems 超級計算機中進行了訓練,是 Cerebras、阿聯酋人工智能大學、阿聯酋 G42 科技集團旗下子公司 Inception(專注于人工智能)之間的合作項目。
Jais 的命名來自阿聯酋的最高峰,阿聯酋人工智能大學教授 Timothy Baldwin 表示,由于沒有足夠的阿拉伯語數據來訓練 Jais 大小的模型,因此英語數據中的計算機代碼有助于訓練模型的推理能力。
▲ 阿聯酋境內最高峰 Jebel Jais
Baldwin 還告訴路透社:“(代碼)在推理能力方面給模型帶來了很大的幫助,因為它闡明了(邏輯)步驟。”
Jais 將通過開源許可證提供,IT之家暫未查到相關項目信息。值得一提的是,阿聯酋G42 集團官網顯示,該公司的 CEO 名叫肖鵬。