9月16日,CCF大數據與計算智能大賽第九屆正式啟動,愛奇藝攜手中國計算機學會,發起劇本角色情感識別挑戰,誠邀全球英才組隊參與,探討技術難題和行業痛點,這也是業內首個基于劇本的角色情感識別挑戰賽。
基于劇本的角色情感識別主要是依托劇本中每句對白和動作描述,對相關角色進行多維度分析,并識別出情感。相對于常見的新聞、評論性文本的情感分析,有其獨有的業務特點和挑戰。
愛奇藝一直致力于為用戶提供更多更好的優秀內容,本賽題也基于愛奇藝業務場景提出,需要參賽者利用自然語言處理和相關的技術手段,來對劇本中存在的多種情感元素進行綜合判斷和識別。
針對這次挑戰賽,愛奇藝商業智能部的高級總監馮長晟表示,內容品質的提升,既依靠藝術工作者的創作和創新,又依靠技術能力的革新和發展。“影視工業化”將是下一個十年中,提升內容品質的關鍵推動力,而劇本評估系統是“影視工業化”中最為基礎也非常關鍵的一環。本次大賽的題目,就依托劇本評估中情感的分析和分類來進行研究。劇本所富含的情感是劇本的靈魂,一個好的劇本總包含著充分的情感釋放,情感分析正是劇本評估中非常有意義的一個方面。
CCF大數據與計算智能賽(CCF Big Data & Computing Intelligence Contest,簡稱CCF BDCI)由中國計算機學會于2013年創辦,是大數據與人工智能領域的算法、應用和系統大型挑戰賽事。本次2021年CCF BDCI第九屆大賽以“數引創新,競促匯智”為主題,立足余杭、面向全球,歡迎各路精英選手前來參賽。
賽題概覽
愛奇藝為本次挑戰賽準備了一部分劇本場景作為訓練集,訓練集數據已由人工進行標注,參賽隊伍需要對劇本場景中每句對白和動作描述中涉及到的每個角色的情感從多個維度進行分析和識別。
本賽題的情感定義共6類(按順序):愛、樂、驚、怒、恐、哀;選手可以根據上述6類情感按固定順序對應的情感值,情感值范圍是[0, 1, 2, 3],0-沒有,1-弱,2-中,3-強,以英文半角逗號分隔;本賽題算法評分將采用常用的均方根誤差(RMSE)來計算評分,按照“文本內容+角色名”識別出的6類情感對應的情感值來統計。
和其他類文體相比,劇本類文本行文風格和通常的新聞類語料差別較大,更加口語化,同時,劇本場景中的對白和動作描述都涉及到角色的情感,而且要從6個維度進行識別,難度也更高;再加上劇本中角色情感不僅僅取決于當前的文本,對前文語義可能有深度依賴,很容易出現識別錯誤。
賽題賽程
本次大賽已于9月16日正式啟動。正式賽共計3個月,采用初賽、決賽、總決賽“三級賽制”,具體賽程安排如下:
2021/09/16-2021/11/22 大賽初賽(線上) (1)2021/09/16 發布大賽賽題,開放正式賽報名 (2)2021/9/22-2021/11/20 初賽A榜階段,開放數據下載,可提交作品、參與A榜評測 (3)2021/11/20 截止正式賽報名、隊伍成員及信息調整 (4)2021/11/22 初賽B榜階段,可提交作品、參與B榜評測 2021/11/23-2021/12/05 大賽決賽(線上) (1)2021/11/23-2021/12/3 對作品代碼、反作弊情況審核,復現成績 (2)2021/12/04-2021/12/5 決賽答辯評審 2021/12中旬 大賽總決賽(線下) (1)2021/12/中旬 舉辦大賽總決賽評審、頒獎典禮等系列活動
獎池獎項
愛奇藝為本次大賽提供了4萬元獎金和豐厚的禮品,具體賽題獎金及獎項如下。
1、單賽題獎
獎項 數量 獎金(¥)
一等獎 本賽題1支團隊 每支隊伍16000元
二等獎 本賽題2支團隊 每支隊伍8000元
三等獎 本賽題2支團隊 每支隊伍4000元
備注:以上獎金指稅前獎金。
2、CCF綜合獎
獎項 數量 獎金(¥)
綜合特等獎 1支團隊 每支隊伍30000元
最佳算法能力獎 1支團隊 每支隊伍10000元
最佳商業價值獎 1支團隊 每支隊伍10000元
最佳創新探索獎 1支團隊 每支隊伍10000元
備注:以上獎金指稅前獎金。