科技日報記者 劉霞
英國《自然》網站近日報道了迄今最大的生物學人工智能(AI)模型Evo 2。該模型基于12.8萬個基因組的數據進行訓練,具備從頭編寫整個染色體和小基因組的能力,為設計全新基因組開辟了一條新路。
在前一代模型Evo 1的基礎上,來自美國弧形研究所、斯坦福大學和英偉達公司的科學家攜手開發出Evo 2。相較于Evo 1在8萬個細菌、古細菌及病毒的基因組數據上進行的訓練,Evo 2的訓練數據量大幅提升,涵蓋了12.8萬個基因組。這些基因組廣泛涉及人類、動植物及真核生物,囊括了9.3萬億個核苷酸。
團隊表示,鑒于解析這些數據及其他特征所需的龐大算力,Evo 2是迄今發布最大的生物學AI模型。Evo 1和Evo 2模型作為“生成式生物學”這一新興領域的重要成果,將進一步加強對生命基本組成部分的了解。
在醫療保健和新藥研發領域,Evo 2模型可幫助了解與特定疾病有關的基因變體。在針對與乳腺癌相關的BRCA1基因變體測試中,Evo 2在預測良性突變和潛在致病突變方面的準確率達90%以上。這將有助于節省大量時間,精確設計出靶向這些變體的新型分子。
此外,在農業方面,Evo 2模型可提供有關植物生物學的新見解,助力開發出更具氣候適應性或營養更豐富的作物品種,為解決全球糧食短缺問題貢獻力量。在材料科學領域,Evo 2模型可用于設計生物燃料或分解石油、塑料的蛋白質。
團隊表示,Evo 2已向全球科研人員開放,他們可通過網頁便捷使用該模型,或免費下載該模型的源代碼、訓練數據及參數,共同探索生物學的奧秘。