2023年1月12日,由國際科技信息中心主辦,AI TIME承辦的SCITIC論壇——探索智慧醫療新范式完美收官。SCITIC論壇由國際科技信息中心傾力打造,圍繞深圳“20+8”產業集群相關方向與研究領域,邀請國內外青年學者、科研與產業界專家進行技術前沿與產業趨勢內容分享,旨在通過前沿領域輸出和觀點思辨來探討各領域的未來發展以及互相之間的交叉與融合。
本次活動是SCITIC論壇系列直播活動的第二期,邀請到了蘇州大學教授,國家杰青何耀,北卡羅萊納大學教堂山分校副教授Guorong Wu和北京智源人工智能研究院研究員付杰。三位專家分別從納米生物醫學、阿爾茲海默癥、蛋白質語言模型等研究出發,為觀眾帶來前瞻性報告與精彩的思辨,共同探索智慧醫療新范式。本次活動共吸引了線上約2.54萬人次觀看,引發了觀眾對智慧醫療的熱議。
一、報告
Guorong Wu:Discovering Novel Mechanisms for Alzheimer’s Disease by Machine Learning
身處大數據時代的我們,可以輕松回答之前難以解釋的生物醫學問題。作為一名計算機科學家,Guorong Wu老師提到在與神經學、遺傳學和成像專家合作的同時,自己對阿爾茨海默病(AD)的病理生理機制的了解也在逐步加深,以及AD相關基因如何影響大腦衰老。他旨在建立一個神經生物學基礎,以量化個體之間的結構、功能、行為差異,并發現可靠和假定的生物標志物。這將可以使我們能夠為個體提出個性化的治療方案。Guorong Wu老師本次帶來的分享主要是如何將人工智能應用到阿爾茲海默病這種老年的退化性疾病上。他將神經科學的領域知識整合到了基于圖像AI的計算工具開發中,并用于自動圖像分析、圖像解釋和結果預測,重點是成像生物標記物和AD的計算機輔助早期診斷引擎。最后,他將最近研究項目的初步結果進行了展示并介紹了實驗室的最新研究方向。
付杰:Understanding & Generating Natural (Human + Biological) Language and Beyond
在人類的自然語言處理中,假設一個詞的意思可以從它的上下文中推導出來,那么生物序列也應該可以在其上下文中進行分析。生物序列建模和人類自然語言處理之間的類比,使得人們得以通過來自人類自然語言處理的深度上下文語言模型來理解和生成蛋白質序列。付杰研究員將自己在這方面的研究概括為六個單詞:understanding & generating natural (human + biological) language。作為一個仍處于起步階段的跨學科領域,卻已經在現實世界有了各種各樣的落地應用。付杰研究員分享了自己在這一領域的最新研究,同時,他還對模塊化神經網絡進行了探討,它可以在微調預訓練的自然語言模型時極大地提高樣本效率。
何耀:淺談納米生物醫學與人工智能結合在癌癥精準檢測中的應用
作為多學科交叉融合形成的前沿領域,納米技術的發展將深刻影響現代科學技術的發展。納米生物與醫學是納米技術的主要方向之一,有望為重大疾病的精準診斷與高效治療提供有力的新工具與新方法。另一方面,人工智能在近幾年發展迅速。隨著人工神經網絡模型的發展,人工智能技術可以對各類數據的數據特征和內在規律進行自動化的學習,以實現模式識別和預測評估等應用。何耀老師主要介紹了納米技術及納米生物醫學的概念及重要性,進而結合報告人團隊的近期研究進展,介紹了自己團隊是如何利用納米生物醫學與人工智能,最終實現了對癌癥疾病從分子水平到組織水平的高靈敏分析檢測。
二、Debate
Data driven(hungry)的預訓練大模型已經大大改變了NLP領域的研究和應用范式。過去幾年已經出現了類似在智慧醫療領域的嘗試,比如ProtTrans這個大型預訓練蛋白質語言模型,還有DNABert這個用于DNA序列的預訓練模型。這個范式會不會也被更廣泛應用到智慧醫療呢?
付杰:我覺得如果要做交叉學科,還是要多學一些其它學科的知識。但其實自己在看待問題的時候,還是會優先從AI的角度出發,去看這個技術能再應用到哪些領域。盡管自己會進行一系列技術應用到其他領域后的分析,卻并不知道最終應用到臨床還會有多久。目前也是在逐漸遠離臨床的部分,畢竟自己不知道眼前的技術應用到臨床還會要多久。
何耀:這里提到科研和臨床的距離還有多少,我覺得其實是需要幾個方面的共同努力。一是過去的好幾年時間,自己一直在做的都是和臨床學習,我覺得我們首先是要聽臨床專家的意見。比如說現在要做一個體內藥物,這個周期是非常長的,畢竟涉及到很多安全性的評估。但是從應用的角度來講,如果我們能做體外的檢測,這個周期就會短很多。我們從科學的角度講,做一個癌癥的檢測是比較容易實現的。但是從臨床角度講,很多marker都沒有真正的完全確定。這也就是為什么我們要做很多很多的marker來做聯合檢測。我們每個人從求學時代開始,包括到后來指導學生,都和我們自身的領域背景有很大關系。因此,我們也需要和其它領域的專家經常交流,同時也能收獲很多對自己有益的啟發。比如說,我們這個論壇也可以未來邀請臨床專家一起參與討論,才有可能把這個領域更高效地往前推進。
Guorong Wu:我認為各學科之間的交流也是一個相互適應的過程,這也是每個人學習成長過程中都會遇到的問題。
付杰:靠近臨床一端的研究論文,似乎不大經常將代碼完全開源。而在計算機領域,代碼開源、數據集開源卻是一個極為常見的現象。
Guorong Wu:這個data sharing問題,往往涉及到的也是data privacy和data secret問題。很多時候用到的數據并不是臨床這邊自己所有的,因此data sharing確實會存在問題。
付杰:但是如果沒有data sharing,似乎就很難誕生預訓練大模型來幫助所有的人。
Guorong Wu:我感覺在變得慢慢傾向于data sharing,整個領域的大趨勢大致是這樣的。
機器學習如何幫助解決老齡人口中的健康差異?
Guorong Wu:這個問題不僅牽涉到機器學習,還涉及社會學等多個學科,取決于如何定義“差異”。如果我們跳出機器學習,可以來看如何利用我們的專長解決這一社會問題——老年退化性疾病。對于老年人,我們確實也發現了很多健康差異,比如性別差異。我們后續在設計算法的同時也應該把性別差異考慮進去。老年癡呆癥和別的疾病癥狀是不一樣的,比如疼痛,老年癡呆癥患者對疼痛的描述和正常的疼痛是不同的。我們現在去醫院看病都會有電子病歷記錄,以往的病史及服藥情況的信息可以給醫生一定的提示來幫助其做出更加精準的診斷。我們也希望可以通過自己的專長解決一些社會性的問題或是幫助政府做出決策時提供更多參考。
付杰:從目前機器學習的角度來講,做這種差異的建模是有很多方法的,如HyperNet。HyperNet可以看做是一個非常神奇的生成器,比方說用一個diffusion model去生成一個matrix,我們完全可以把這個matrix看成是一張圖片,但同樣可以將其看作是另外一個network參數的value。我們告訴HyperNet這個任務是一個女性,將要輸入的task information告訴HyperNet之后,可預見是他會生成一個特異化的function的參數值來解決這一問題。如果我們告訴HyperNet這個人是男性,就可以生成另外一個function。這是可以特異化去做這些事情的,至少有工具可以幫助我們做到。
何耀:剛剛也有提到,現在的老年人疾病如腦萎縮、老年癡呆等疾病很多都是和腦科學緊密相關的。單純從細分領域來講,Brain Science腦科學很火,但是又存在著很多懸而未決的關鍵問題。有沒有可能將機器學習這方面的專家和腦科學方面的專家通過項目等方式更高效的結合在一起,一起來做出更多的貢獻。這都是需要嚴肅思考的,也是一個很大的機會。
付杰:對于何老師剛剛提到的問題,之前有了解到過一些相關信息。事實上很多人是不支持這個想法的,因為他們認為盡管深度學習最初來自于人腦,但是有很多東西并不是受到人腦啟發而得到的,因此他們認為機器學習算法沒有必要去借鑒腦科學。
Guorong Wu:我也看到過這個觀點,但是人工智能和腦科學的結合在動物學上還是非常重要的。
納米生物醫學與人工智能相結合用于疾病精準防治,有哪些重要的機遇與挑戰?未來發展趨勢如何?
何耀:我覺得醫學不止是納米生物醫學,醫學發展的最終目的是服務于人類的健康和幸福生活。對于實現疾病的極早期檢測和精準治療,我認為從醫學和人工智能來講是有很大空間的。我們自己從生命學角度關注的腦科學和人工智能,不一定是說用人工智能模擬人的大腦。我們可以利用人工智能或機器學習的方法來更好的了解腦的功能,比如說腦疾病的發生和發展等等。我們是希望可以去了解腦科學疾病的,同時去有效地預防疾病。這也就體現了人工智能的重要。研究腫瘤疾病時的信息量要比大腦的信息量少很多,但是研究腫瘤就已經足夠復雜了,研究大腦的復雜性可想而知。這種挑戰其實可以說是學科壁壘的挑戰,因為當我們討論腦科學的時候,從生物醫學的角度和機器學習的角度來看都是不一樣的。到了之后臨床的時候,甚至會出現很大牽涉到病人家屬的倫理問題。我們只有在那個環境下,才能明白臨床專家的思維角度。怎樣才能打破這樣的壁壘?像今天的論壇當然是越多越好,比如我們之后也可以邀請一位臨床專家加入我們的探討,這樣大家對彼此角度的理解才能夠更加深入。
Guorong Wu:我對這個還是蠻樂觀的,我們也可以看到近10年里科技的飛速發展。只要大家都認識到這個問題,而且認為這是個重要的問題,增加人力、物力的投入是能夠將問題解決的。
付杰: 我覺得目前學術界對文章作者排名的方式也不太利于將這么多不同學科的人投入到同一個研究項目中去。只有reward和想做的事是連接在一起的,做起事來才會比較容易。
國際科技信息中心:
國際科技信息中心是致力于打造數據與知識雙輪驅動的認知智能平臺,涵蓋基礎設施、科技文獻、科技數據、科技情報、高端智庫和智能服務等體系。
SCITIC論壇由國際科技信息中心傾力打造,圍繞深圳“20+8”產業集群相關方向與研究領域,邀請國內外青年學者、科研與產業界專家進行技術前沿與產業趨勢內容分享,旨在通過前沿領域輸出和觀點思辨來探討各領域的未來發展以及互相之間的交叉與融合。
AI TIME:
AI TIME源起于2019年,旨在發揚科學思辨精神,邀請各界人士對人工智能理論、算法和場景應用的本質問題進行探索,加強思想碰撞,鏈接全球AI學者、行業專家和愛好者,希望以辯論的形式,探討人工智能和人類未來之間的矛盾,探索人工智能領域的未來。
迄今為止,AI TIME已經邀請了900多位海內外講者,舉辦了逾450場活動,超500萬人次觀看。