2023全球數商大會于11月25-26日在上海成功舉辦,活動期間共舉辦1場開幕式、1場主論壇、1場數據交易節及20場主題論壇。11月26日,由中國大模型語料數據聯盟指導,上海數據交易所、星環信息科技(上海)股份有限公司主辦,上海市數商協會協辦的“數據要素市場與大模型語料庫論壇暨中國大模型語料數據聯盟開放日活動”成功舉辦,活動上200余家大模型數據、人工智能及技術企業及相關機構代表出席會議。
上海市經信委信息化推進處處長錢曉致辭表示,大模型發展到現階段,高質量的語料數據尤為的重要。在政策引領方面,11月,上海經信委發布了《上海市推動人工智能大模型創新發展若干措施》,推出11條措施。推動大模型預訓練模型創新發展,著力支持大模型創新能力,提升創新要素供給能級,推進大模型創新應用,營造一流創新環境。在生態建設方面,今年上海成立了中國大模型語料數據聯盟,旨在通過鏈接模型訓練、數據供給、學術研究、第三方服務等多方面,機構聯合打造國際化開放性的大模型語料數據生態。
本次活動上,上海市新能源汽車公共數據采集與監測研究中心、華院計算技術(上海)股份有限公司、星環信息科技(上海)股份有限公司、上海市人工智能行業協會、上海稀宇科技有限公司、上海四維數邦數字科技有限公司、上海世紀出版(集團)有限公司、上海第二工業大學、上海市人民檢察院、瑞因凡(上海)智能科技有限公司、北京晴數智慧科技有限公司、北京清博智能科技有限公司12家新成員單位加入“中國大模型語料數據聯盟”,將共同為大模型技術深度發展與高水平應用提供更多元的數據要素保障。上海人工智能實驗室生態中心負責人,合作交流與知識產權部部長王宇,人民網上海頻道總經理金煜純為各單位頒發了入盟紀念證書。
為推動大模型技術快速發展,供給豐富且高質量的開源數據,本次活動中,由市統計和大數據研究院、上海圖書館(上海科學技術情報研究所)、上海仲裁委員會三家單位共同發布專業數據集,涉及上海統計年鑒數據集、中國家譜總目數據集和國際仲裁法律、規則與實踐數據集,數據模態豐富。
隨著數據的爆炸式增長,數據安全和隱私保護問題日漸重要,數據治理在新時代的使命,不僅是對數據進行有效管理,更是要確保數據安全和隱私保護,今天的活動上由上海人工智能實驗室和人民網兩家聯盟發起單位正式揭牌成立中國大模型語料數據聯盟安全治理專委會,旨在推動大模型數據安全治理,保障大模型技術快速發展。
活動上,上海人工智能實驗室生態中心負責人,合作交流與知識產權部部長王宇,人民網上海頻道總經理金煜純。上海人工智能實驗室治理研究中心副主任王迎春圍繞《構建高質量的大模型語料數據生態》、人工智能治理及《生成式人工智能——合規性評估與語料庫建設》發表了演講。
未來,聯盟將持續發揮好“朋友圈”作用,凝聚各方資源,發揮各成員單位優勢,群策群力,共同推動大模型語料數據高水平供給,為我國大模型發展做好數據支撐。
論壇匯聚了各行業對大模型時代的思考,星環科技聯合創始人,技術副總裁劉汪根、中金計算機首席分析師于鐘海、上海數據交易所市場發展部副總經理章健、交通銀行軟件開發中心綜合業務產品部副處長姚利虎、科大訊飛AI工程院副院長劉坤、上海財聯社技術總監葉周發表主題演講。
中國大模型語料庫的價值與挑戰圓桌對話環節,星環科技智能量化事業部總經理曾晨光主持,上海市經濟和信息化委員會信息化推進處干部薛威、復旦大學大數據學院副院長陽德青、上海財聯社技術總監葉周、上海數交所技術開發高級經理孫江,在主管機構、學界、數據機構、交易所視角共同探討中國大模型語料庫建設。