国产电影精品一区-日韩专区一区-亚洲小说欧美激情另类,亚洲精品在线观看视频,欧美性生交大片免费看app麻豆,久久99国产精品二区不卡

大模型學會寫萬字長文,AI企業「波形智能」完成千萬元Pre-A輪融資 | 36氪首發

業界
TIME
2024-01-29 19:10
36氪
分享

  文 | 周鑫雨

  編輯 | 鄧詠儀

  36氪獲悉,近日杭州波形智能科技有限公司(以下簡稱“波形智能”)已完成千萬元級Pre-A輪融資。該輪由藍馳創投領投,西湖科創投、螞蟻金服董事長井賢棟、知名天使人費革勝、老股東藕舫天使跟投。

  波形智能團隊成員多有科班出身的NLP研究和海外背景,在長文本生成、Agent框架能力、大模型微調與壓縮等領域上具有一定技術積淀以及全球化的視野:

  創始人兼CEO姜昱辰本科畢業于浙大竺可楨學院,博士就讀于蘇黎世理工大學,師從國際著名學者Ryan Cotterell,曾在微軟亞研院從事大語言模型的訓練與推理。CTO周王春澍,博士同樣就讀于蘇黎世聯邦理工大學,從事人工智能方向研究。CPO萬磊,騰訊出身,過億月活社交APP高級產品經理,多款AI產品創始人。聯合創始人兼COO余騰,曾任美國上市公司掌門教育(ZME)聯合創始人兼營銷高級副總裁。

  2023年下半年以來,行業已經涌現了一批成功提升“記憶力”的大模型,模型上下文窗口從32K,擴展到了一次能理解40萬字左右文本的200K。

  讓大模型讀懂超長文本,逐漸不是難題;但讓大模型像人一樣寫萬字小說,并不簡單。

  由于內容規劃(如何從輸入的數據中選擇重要信息)和表層實現(用自然語言形式正確地描述重要信息)仍是難以攻克的難題,生成連續、連貫的長文本尚難以實現。

  與此同時,理解和生成長文本對算力和內存提出了更高的要求。波形智能CEO姜昱辰告訴36氪,大語言模型主流采用的是Transformers架構,但缺點在于,其在處理長序列時會面臨計算和存儲的需求挑戰,文本越長,循環次數越多,算力和內存成本會平方級上漲。

  對此,波形智能主攻內容創作垂域的長文本生成,于2024年1月29日的技術開放日上發布了一款能生成長文本的大模型:內容創作垂域SOTA大模型“Weaver”。

  為了在控制成本的情況下做到無限長文本生成,波形智能曾在2023年5月發表了名為RecurrentGPT的訓練范式。姜昱辰介紹,在實際測評中,RecurrentGPT在比GPT-4的文本生成速度快三倍的情況下,書寫的效果還要更出色。

  通過適配RecurrentGPT框架,Weaver具備更強的長文本生成能力,在長文本和結構化文本生成的上下文一致性上提高了40%。相較于2倍量級參數規模的模型,Weaver系列模型的生成速度更快且效果更好。

  基于《繁花》風格,Weaver(右)與GPT-4(中)生成效果的對比。圖源:波形智能

  應對模型“一本正經胡說”的幻覺問題,Weaver也有了新的解法。2023年9月,波形智能還設計了基于SOP(標準操作流程)的Agent架構:AIWaves Agents。通過對創作文本的過程進行模擬,Agent會根據撰寫的題材自主判斷什么時候進入劇情設定、角色設定、文風設定等不同階段,以及不同階段需要調取什么樣的知識庫。

  與AIWaves Agents框架適配后,Weaver還支持函數調用,擁有超過1000個API上的綜合訓練經驗,能夠實現根據用戶意圖自動理解、規劃復雜指令,執行文件處理、數據分析、圖表繪制等復雜任務。

  更重要的是,要讓模型在內容創作領域落地,就必須要讓機器寫作更有“人味”。

  為此,針對模型預訓練階段,波形智能自研了一套自動標注系統“Instruction Back Translation(指令回譯)”,確保輸出結果是由專業寫手產出的內容。

  針對對齊階段,波形智能自研的對齊技術“Constitutional DPO(根據法則的直接偏好優化)”,能夠以專業寫作方法論為度量標準,指導對齊數據的自動生成。

  此外,相較于通用大模型,Weaver還支持個性化知識庫的調用。通過利用自研向量數據庫生成原生(native)個性化模型,Weaver將召回內容的利用率(指的是召回內容能被輸出內容有效利用的比例)提高50%。通過RAG(檢索增強生成技術)+仿寫的技術方案,Weaver將“越寫越懂你”,逐步實現個性化的內容生成。

  相較于通用大模型,Weaver能夠在更深更廣的創作垂直領域落地。目前,Weaver支持寫大綱、續寫、潤色、風格遷移等10類寫作任務,覆蓋爽文/小說、工作總結、營銷寫作等30多個領域。

  在技術開放日上,波形智能還推出了由Weaver驅動的AI輔助創作工具“蛙蛙寫作1.0”。

  這款面向專業作者、自媒體/文案創作者的To C生產力工具,為用戶提供了模塊化的功能。用戶可以根據創作需求,一次性輸出文本,或者按照大綱-章節的順序分步寫作。同時,蛙蛙寫作的寫作速度能夠達到10分鐘1萬字。

  蛙蛙寫作可生成情節和文本。圖源:波形智能

  目前,蛙蛙寫作的商業模式主要為按月訂閱,價格為29元/月。與此同時,蛙蛙寫作也為企業提供定制化解決方案,并面向開發者開放了API。

  姜昱辰對36氪表示,融資款將用于Weaver大模型和Agents平臺的研發及其商業化。她透露,2024年第一季度,波形智能將發布70B的模型Weaver Ultra-Max,以及新一代Agent平臺Agents2.0。針對劇本創作、私人客服、智能推薦等場景,Agents2.0平臺將支持對Weaver大模型的自動微調優化。

  歡迎交流!

THE END
免責聲明:本文系轉載,版權歸原作者所有;刊載之目的為傳播更多信息,如內容不適請及時通知我們。

相關熱點

  1月29日消息,據國內媒體報道稱,我國第10座超大城市來了,其就是杭州。  根據國務院對城市規模的劃分,城區人口300萬以上為大城市,500萬以上為特大城市,1000萬以上為超大...
業界
  新華社長春1月29日電(記者宋心平、張博宇、魏蒙)正值冰雪旅游旺季,中國東北長白山迎來游客往來最熱鬧的時段。但在長白山下的吉林省白山市撫松縣,當地機場卻拿出一整個...
智能AI

相關推薦

1
3