国产电影精品一区-日韩专区一区-亚洲小说欧美激情另类,亚洲精品在线观看视频,欧美性生交大片免费看app麻豆,久久99国产精品二区不卡

AI 大模型的語言不平等:英語最便宜,其它語言要貴得多

業界
TIME
2023-07-31 08:40
IT之家
分享

  IT之家 7 月 31 日消息,用戶所使用的語言對于大型語言模型(LLM)的費用有很大的影響,可能造成英語使用者和其它語言使用者之間的人工智能鴻溝。最近的一項研究顯示,由于 OpenAI 等服務所采用的的服務器成本衡量和計費的方式,英語輸入和輸出的費用要比其他語言低得多,其中簡體中文的費用大約是英語的兩倍,西班牙語是英語的 1.5 倍,而緬甸的撣語則是英語的 15 倍。

  IT之家注意到,推特用戶 Dylan Patel(@dlan522p)分享了一張照片,展示了牛津大學進行的一項研究,該研究發現,讓一個 LLM 處理一句緬甸語句子需要 198 個詞元(tokens),而同樣的句子用英語寫只需要 17 個詞元。詞元代表了通過 API(如 OpenAI 的 ChatGPT 或 Anthropic 的 Claude 2)訪問 LLM 所需的計算力成本,這意味著緬甸語句子使用這種服務的成本比英語句子高出 11 倍。

  詞元化模型(即人工智能公司將用戶輸入轉換為計算成本的方式)意味著,除了英語之外的其他語言使用和訓練模型要貴得多。這是因為像中文這樣的語言有著不同、更復雜的結構(無論是從語法還是字符數量上),導致它們需要更高的詞元化率。例如,根據 OpenAI 的 GPT3 分詞器 ,“你的愛意(your affection)”的詞元,在英語中只需要兩個詞元,但在簡體中文中需要八個詞元。盡管簡體中文文本只有 4 個字符(你的愛意),而英文有 14 個字符。

THE END
免責聲明:本文系轉載,版權歸原作者所有;刊載之目的為傳播更多信息,如內容不適請及時通知我們。

相關熱點

  7月28日,闊別已久的ChinaJoy在上海新國際博覽中心拉開帷幕。作為當今全球數字娛樂領域最具知名度與影響力的年度盛會之一,ChinaJoy已陪伴中國數字娛樂產業走過了二十...
熱點
  2023 年 7 月 23 日是我國成功發射首個火星探測器天問一號三周年的日子。在這三年里,天問一號實現了工程和科學兩個領域的雙豐收,超額完成了既定任務。  “一舉三...
互聯網

相關推薦

1
3