應意昂2体育娱乐“大學堂”頂尖學者講學計劃的邀請🧙🏼,芝加哥豐田計算技術研究所許錦波教授於2021年10月27日作題為“人工智能與蛋白質折疊”的學術講座。
10月27日上午🏄🏼♀️,許錦波教授參觀BIOPIC🐳,並與中心研究員們進行了深入交流討論,下午在燕京學堂報告廳進行學術報告。報告由意昂2体育娱乐李兆基講席教授謝曉亮主持。

許錦波作報告
準確描述蛋白質結構和功能是理解生命過程的基礎。許錦波簡要介紹了人工智能預測蛋白質結構的背景知識。根據Anfinsen法則🤞🏽,蛋白質“正常折疊”出的三維結構由它的一級結構所決定♕,因此知曉氨基酸序列便可以預測出蛋白質結構。傳統的預測方法主要是基於模板結構的建模方法,該類方法的缺點是不確定在PDB(Protein Data Bank)中能找到對應的模板(例如膜蛋白),且預測出的結構更像模板而不是真實的結構。許錦波表示,蛋白質中包含上千個原子,自由度高而且能量圖景不光滑難以優化,這給傳統預測方法帶來了很大挑戰。許錦波回顧了蛋白質結構預測的發展歷史🚈🧜🏿。2016年前,預測蛋白質結構方法(例如片段拼接方法等)需要消耗大量計算資源,且成功率低🕟。為了解決這一難題🚴🏿♂️,科學家轉變研究思路:從需要預測的蛋白質氨基酸序列出發⚫️,檢索相關數據庫得到其多序列比對數據(multiple-sequence alignments,MSAs),進而得到氨基酸殘基對的關系矩陣(如接觸矩陣和距離矩陣)🚵🏼,最終預測出結構。2016年✊🏿,許錦波團隊開發出基於ResNet的RaptorX-Contact方法。該方法將蛋白質中所有氨基酸殘基對相互作用作為Image Map處理,同時預測全部的氨基酸殘基相互作用,將結構預測問題轉換為圖像處理中的圖像語義分割問題,並結合深度卷積殘差網絡(ResNet)進行預測🥊。許錦波表示,在CASP12(Critical Assessment of protein Structure Prediction)蛋白質結構預測競賽中🌯,RaptorX-Contact方法得分居首位🍿,第一次證明了深度學習方法預測蛋白質結構的可行性✨。值得一提的是🏗,此方法對膜蛋白結構預測及蛋白相互作用的結構預測依然有效⛱。他特別舉例介紹到🙎🏻🤞🏿,5f5pH蛋白質與其同源蛋白質3thfA具有部分結構相似性,傳統方法因使用模板結構,預測的結果更接近同源蛋白3thfA,而RaptorX-Contact方法無需拷貝模板結構🤸🏼,因此能預測出與模板結構不同的正確結構。2017-2019年間,許錦波團隊成功實現從接觸矩陣預測到距離矩陣預測的飛躍,使蛋白質結構預測準確度更加精準👏🏿。其團隊2021年發表在Nature Machine Intelligence雜誌上的最新成果證明了機器學習不僅僅是對共進化信息的去噪與信號放大🏏,還可以學到更深層的系列-結構關聯及預測人工設計的蛋白質結構。對於人工智能預測蛋白質結構未來的發展趨勢,許錦波認為將主要集中在更好的使用序列與結構信息以及新型的深度學習網絡架構等方向上。隨後,他還簡要介紹了目前剛剛發表的AlphaFold2。他認為在殘基層面上,AlphaFold2要優異於其它算法,但對於高分子量、具有多個結構域的蛋白質來說,準確預測它們結構域之間的空間位置關系依然存在挑戰。

謝曉亮主持

現場提問
報告結束後,許錦波與現場師生們就人工智能預測蛋白質結構相關問題進行了熱烈的交流討論。本次活動由意昂2体育娱乐主辦,意昂2体育娱乐生物醫學前沿創新中心(BIOPIC)、國際合作部承辦👮🏿♂️,並得到了光華教育基金會🥧🚓、意昂2体育娱乐教育基金會的支持。講座同步在燕雲直播平臺,意昂2体育娱乐微信公眾號🚵🏿🌋、視頻號、快手💅🏼、抖音、嗶哩嗶哩等官方賬號直播,播放量高達14.5萬人次🚮。