国产电影精品一区-日韩专区一区-亚洲小说欧美激情另类,亚洲精品在线观看视频,欧美性生交大片免费看app麻豆,久久99国产精品二区不卡

大模型的“繁花”時代到了!中國電信星辰語義大模型震撼開源!央企首家開源!

業界
TIME
2024-01-13 09:45
C114通信網
分享

  這兩天,由胡歌主演的電視劇《繁花》迎來大結局。在最后一刻,寶總轉危為安,擺脫破產風險,玲子、汪小姐也迎來各自的結局。劇中人物處于巨變繁花時代,有著做時代弄潮兒的亢奮勁頭,寄托著觀眾對美好未來的騏驥。

  可喜的是,屬于國產大模型領域的繁花時代來了!1月10日,中國電信星辰語義大模型TeleChat-7B版本(簡稱TeleChat)宣布開源,開放1T高質量清洗數據集。此外,中國電信將在1月底開源12B版本模型,為國產大模型發展注入新動能。

  值得一提的是,星辰語義大模型已經適配昇騰AI基礎軟硬件。雙方強強聯合,構建國產化生態閉環,共同推動國產大模型在千行百業落地。

  歷經2023年百模大戰洗禮,各家大模型已經在語言、語音、視覺等領域獲得強大的生成能力。我們關心的是,星辰語義大模型的模型能力如何?其強大后盾何在?本次中國電信大模型開源將對行業帶來哪些影響?我們來一一分析。

中國電信開源星辰語義大模型,搶灘大模型賽道

  生成式AI作為人工智能的iPhone時刻,于剛剛過去的2023年,在國內掀起一場轟轟烈烈的百模大戰。根據《2023中國新一代人工智能科技產業發展報告》顯示,目前全國共有2200家人工智能企業,國內大模型總數達238個。無論是參與企業規模,還是大模型數量,中國已然成為僅次于美國的全球第二大大模型產業中心。

  身處轉型升級時期的電信運營商,自然也不愿錯過這趟AI時代的列車。2023年11月,中國電信在2023數字科技生態大會上發布了千億參數星辰語義大模型,并公布了后續的開源開放的時間表,并承諾面向開發者提供各類大模型工具支持。

  這次,中國電信不僅將TeleChat-7B版本及其int8和int4量化版本的代碼開源到Github社區,還同步上架到國內開源社區Gitee。

  對于關注大模型的企業,這無疑是個利好消息,開發者可以直接下載TeleChat-7B int8量化鏡像,大大加速了面向不同場景的大模型開發進程。

  在這次開源信息中我發現一個亮點,那就是星辰語義大模型支持基于昇騰的Atlas 300I Pro推理卡運行推理任務。目前在搜索推薦、內容審核和OCR系統場景下有不錯的表現。同時,星辰語義大模型可基于Atlas 訓練服務器進行訓練,支持PyTorch框架的基礎上,增加了對昇思MindSpore框架的支持。模型精度、性能均表現不俗。

  如前文所言,國內似乎并不缺大模型,最新的大模型數量已經超過了238個,但有強有弱。那么相比而言,中國電信推出的星辰語義大模型,其模型能力如何?技術亮點何在?

  星辰語義大模型的優勢很多,比如參數升級到千億、支持 96K Token 上下文理解等。這里我想著重說的是大模型一直以來的老大難問題——幻覺,畢竟如果大模型在金融、法律等專業領域一本正經地胡說八道,會使得其專業性大打折扣。

  而星辰語義大模型在業界首次提出緩解多輪幻覺的解決方案,通過關鍵信息注意力增強、知識圖譜強化、多輪知識強化、知識溯源能力四大技術,將AI大模型的幻覺率降低了40%,這有助于大模型變得更有人味,真正去理解問題本身,告別風馬牛不相及的答案。

  說到這,你肯定很關心,本次開源的星辰語義大模型具備哪些能力,能為你的企業做哪些事?

  我總結了四點:

  一是支持deepspeed微調,開源基于deepspeed的訓練代碼,支持Zero并行顯存優化;

  二是多輪能力支持,開源多輪數據構建方式,集成針對多輪的mask loss訓練方式,提升問答效果;

  三是外推能力提升,開源8K訓練版本模型,還能外推到96K;

  四是長文生成能力很贊,對工作總結、PPT大綱、招標書等長文寫作任務,均能勝任。

  星辰語義大模型表現不俗,離不開中國電信三大后盾

  開發出大模型只是打好地基,能為行業帶來價值才是關鍵。

  目前國產大模型很多,但是基于大模型開發的AI原生應用卻很少。在大模型的應用場景落地上,星辰語義大模型在中國電信內部以及對外企事業單位客戶的業務上,取得不錯的反饋效果。

  一方面,在中國電信內部,星辰語義大模型賦能行文寫作、代碼編程、網絡故障分析以及經營分析等場景,以行文寫作為例,其平均生成字數超過1500字,有效采納率達到85.7%。

  另一方面,在對外項目中,星辰語義大模型賦能企業經營分析、政務公開咨詢、民生訴求接待等場景。

  星辰語義大模型能有如此不俗的表現,是因為它站在巨人的肩膀上跳舞,其背靠著中國電信算、數、法三重強大后盾作為支撐。

  其一,海量數據。中國電信在基礎數據沉淀、數據流轉通道和數據標注三個方面有核心數據優勢。其中,基礎數據包括全國海量熱線咨詢對話數據、大量工單辦理數據、產品和活動數據。同時,中國電信使用大量通用知識數據,為大模型算法訓練提供堅實基礎。

  其二,大規模算力資源。新型深度學習架構Transformer,在人工智能架構中占據主導地位,目前主流AI模型和產品都是基于Transformer構建,大模型對算力提出極大的要求。

  中國電信在2+3+7+N+M布局基礎上,構建中心、省、邊緣、端的四級算力體系,打造可滿足多個大模型同時訓練的公共智算中心,實現分布式算力基礎設施的高效互聯。

  其三,頂尖算法團隊。中國電信大模型由下屬專業AI公司——中國電信人工智能科技公司(簡稱電信智科)負責開發,并建立起高精尖的業界頂尖算法科學家團隊,在語音、語義、圖像等領域進行業界核心領先算法進行自研攻堅。

  據了解,電信智科員工人數800人,研發人員占比75%,均是來自一線科技公司的資深工程師和來自國內外一流高校的應屆生。厚實的人才積累使得公司能在對內對外業務中,取代外部算法能力,實現核心算法能力的自主可控。

  國產大模型迎來繁花時代

  為了搶灘大模型賽道,中國電信有著自己的思考,總結起來就是三條腿走路——模型能力、場景落地和開放生態。其中,開放的生態環境是重中之重。

  縱觀當前國內研發大模型的企業,主要以互聯網大廠和專業大模型公司為主。不少傳統行業開發者空有一身行業能力,但苦于沒有技術能力和外圍資源,只能對大模型望而生嘆。

  但本次的TeleChat-7B版本開源,夯實了中國電信構建開放生態的重要一環,降低了開發大模型的門檻,讓國內企業集體上車,讓企業可以在中國電信構建的大模型、算力等地基上穩穩地造。這體現了中國電信作為央企的責任傳承,有力支持服務型、科技型、安全型企業發展目標落地。

  與此同時,我國大模型還存在自主關鍵技術不足的問題,針對這一點,中國電信在核心算法上選擇自研攻堅,并攜手昇騰AI構建開源生態,充分體現了中國電信要做AI領域央企第一、國內前三的信心和決心。

  整體上看,此次星辰語義大模型開源,說明屬于國產大模型的繁花時代來了。面向未來,希望中國電信拾級而上,持續助力大模型快速落地到千行百業,成為推動產業升級的中堅力量。

  可訪問開源倉了解詳情:

  Gitee地址:

  https://gitee.com/Tele-AI/tele-chat

  Github地址:

  https://github.com/Tele-AI/Telechat

THE END
免責聲明:本文系轉載,版權歸原作者所有;刊載之目的為傳播更多信息,如內容不適請及時通知我們。

相關熱點

  日前,有網友在社交平臺分享了一張在法國巴黎偶遇馬云的照片。  從照片來看,馬云身穿深色外套和灰色褲子,臉上掛著微笑,應該還換了新的發型,看起來精神十足,風采依舊。...
互聯網
  中央經濟工作會議提出,要大力推進新型工業化,發展數字經濟,加快推動人工智能發展。  2023年10月18日,中國在第三屆“一帶一路”國際合作高峰論壇期間發布《全球人工...
智能AI

相關推薦

1
3