科技日?qǐng)?bào)記者 崔爽
人工智能是引領(lǐng)當(dāng)前新一輪科技革命與產(chǎn)業(yè)變革的戰(zhàn)略性技術(shù)。今年的政府工作報(bào)告提出,持續(xù)推進(jìn)“人工智能+”行動(dòng),將數(shù)字技術(shù)與制造優(yōu)勢(shì)、市場(chǎng)優(yōu)勢(shì)更好結(jié)合起來,支持大模型廣泛應(yīng)用。
在科學(xué)領(lǐng)域,人工智能驅(qū)動(dòng)的科學(xué)研究(AI for Science)是落實(shí)和響應(yīng)國家《新一代人工智能發(fā)展規(guī)劃》,加速我國科學(xué)研究范式變革和能力提升,提升我國科技創(chuàng)新能力、搶占全球科技制高點(diǎn)的重要支撐。日前,中國工程院院士、之江實(shí)驗(yàn)室主任、阿里云創(chuàng)始人王堅(jiān)表示,“賦能”這個(gè)詞低估了人工智能對(duì)科學(xué)的顛覆,人工智能不是一次工具的革命,而是一次科學(xué)革命的工具或者是科學(xué)革命性的工具。
在青藏高原追溯水的來源,對(duì)珊瑚礁進(jìn)行生態(tài)分析,實(shí)現(xiàn)自主天文觀測(cè)……在人工智能驅(qū)動(dòng)科學(xué)研究的浪潮下,中國科學(xué)院多個(gè)研究所正通過接入阿里通義千問QwQ-32B推理大模型,掀起一場(chǎng)從“上天”到“入地”,從“觀星”到“察水”的科研智能化遠(yuǎn)征。
探索太陽耀斑之謎
耀斑是太陽最劇烈的活動(dòng)現(xiàn)象之一,每隔11年就會(huì)大爆發(fā)。一次典型的X級(jí)耀斑,能在幾十分鐘內(nèi)釋放出相當(dāng)于100億顆氫彈同時(shí)爆炸所釋放的能量。
為了破解耀斑爆發(fā)之謎,過去很多科學(xué)家從耀斑演化的物理過程進(jìn)行研究,希望透過物理機(jī)理尋找爆發(fā)先兆。近年來,學(xué)者們從數(shù)據(jù)驅(qū)動(dòng)角度出發(fā),開始用深度學(xué)習(xí)、機(jī)器學(xué)習(xí)等技術(shù)開展研究。然而,隨著觀測(cè)數(shù)據(jù)的不斷積累和數(shù)據(jù)特征維度的不斷增加,對(duì)算法規(guī)模的要求越來越高,研究人員亟需對(duì)海量多模態(tài)數(shù)據(jù)進(jìn)行有效處理,以探索太陽耀斑之謎。
大模型的出現(xiàn)帶來新解法。
在中國科學(xué)院國家天文臺(tái),科研人員利用阿里千問QwQ-32B構(gòu)建的金烏·太陽大模型,對(duì)太陽耀斑進(jìn)行精準(zhǔn)預(yù)測(cè)。
國家天文臺(tái)人工智能小組核心成員李瑀旸對(duì)科技日?qǐng)?bào)記者介紹,在Qwen系列模型的基礎(chǔ)上,團(tuán)隊(duì)通過監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí),訓(xùn)練模型“理解、回答太陽物理問題”和“認(rèn)識(shí)、分析太陽圖像”的能力。其中,太陽耀斑爆發(fā)預(yù)報(bào)任務(wù)以SDO(太陽動(dòng)力學(xué)天文臺(tái))衛(wèi)星公開數(shù)據(jù)、懷柔基地35厘米磁場(chǎng)望遠(yuǎn)鏡數(shù)據(jù)和夸父一號(hào)(ASOS)全日面矢量磁像儀數(shù)據(jù)為主要數(shù)據(jù)源進(jìn)行訓(xùn)練和測(cè)試,預(yù)測(cè)準(zhǔn)確率達(dá)到領(lǐng)域內(nèi)前沿水平。
“天文大模型‘星語3.0’則接入興隆天文臺(tái)司天mini望遠(yuǎn)鏡矩陣,可自主控制觀測(cè)、分析數(shù)據(jù)并推薦后續(xù)計(jì)劃。”李瑀旸介紹,“全新升級(jí)的星語大模型正在向智能體方向發(fā)展,將吸收更多細(xì)分領(lǐng)域知識(shí),融合現(xiàn)有科研模型、算法,進(jìn)一步提升科研效率。”
他還提到,科研對(duì)數(shù)據(jù)安全要求極高,因此,部分科研場(chǎng)景會(huì)把模型部署在本地,對(duì)此,QwQ-32B還能提供相對(duì)更低的部署成本,并且能滿足相關(guān)研究對(duì)模型能力的要求。
支撐青藏高原生態(tài)保護(hù)
青藏高原是世界屋脊、亞洲水塔,是地球第三極,也是未來全球氣候變化影響不確定性最大的地區(qū)。第二次青藏科考發(fā)現(xiàn),青藏高原固態(tài)水正在快速融化、液態(tài)水呈增加趨勢(shì),亞洲水塔失衡。
氣候變化導(dǎo)致的不確定性,會(huì)對(duì)青藏高原造成潛在的水資源和能源保供風(fēng)險(xiǎn)。
為此,中國科學(xué)院青藏高原研究所聯(lián)合阿里云打造了首個(gè)專注于氣候變化適應(yīng)領(lǐng)域的水-能-糧多模態(tài)推理大模型——洛書。
水-能-糧耦合是指水資源、能源系統(tǒng)和糧食生產(chǎn)之間復(fù)雜的相互依存和影響關(guān)系,這種關(guān)系在可持續(xù)發(fā)展的框架下尤為重要。它強(qiáng)調(diào)了這三個(gè)領(lǐng)域在資源利用、生態(tài)影響和社會(huì)經(jīng)濟(jì)發(fā)展中的緊密聯(lián)系,以及協(xié)調(diào)管理這些資源以實(shí)現(xiàn)長期可持續(xù)性的必要性。氣候變化會(huì)加劇水資源壓力、能源需求波動(dòng)和糧食生產(chǎn)不穩(wěn)定性。因此,研究水-能-糧耦合對(duì)于制定更有韌性的應(yīng)對(duì)策略至關(guān)重要,尤其在西藏地區(qū)。
中國科學(xué)院青藏高原研究所助理研究員夏萃慧介紹,洛書基于兩個(gè)模型打造:底層是中國科學(xué)院青藏所自研的科學(xué)模型思源(HydroTrace),依托青藏高原的時(shí)空數(shù)據(jù)訓(xùn)練而成,輸出結(jié)果包含兩部分,一是直接支撐水電生產(chǎn)預(yù)測(cè)的徑流量,二是精準(zhǔn)描繪水文過程的高維數(shù)據(jù)。“但這些數(shù)據(jù)人類無法直接理解和使用,思源接入通義千問后,可實(shí)現(xiàn)自然語言的查詢和輸出,將高維數(shù)據(jù)可視化呈現(xiàn),一線人員據(jù)此直接決策。”夏萃慧表示。
更值一提的是,洛書大模型結(jié)合科學(xué)模型和通義千問Qwen-32B,可以直接對(duì)數(shù)據(jù)進(jìn)行推理分析、得出結(jié)論。“比如在枯水期要觀測(cè)什么,未來要做哪些工作來適應(yīng)氣候變化等等,現(xiàn)在都可以通過推理大模型得到解釋,輔助決策。”夏萃慧說,在這項(xiàng)研究中,團(tuán)隊(duì)還借助阿里云提供的AI計(jì)算資源、數(shù)據(jù)存儲(chǔ)和深度學(xué)習(xí)平臺(tái),高效處理海量數(shù)據(jù)和復(fù)雜的計(jì)算任務(wù),實(shí)現(xiàn)對(duì)模型的快速實(shí)驗(yàn)和迭代,大幅提升科研效率。
未來,洛書還將接入Qwen-VL以高效識(shí)別圖像數(shù)據(jù),與智能體Agent、具身智能觀測(cè)和空天地一體化動(dòng)態(tài)數(shù)據(jù)中心一起,為青藏高原生態(tài)保護(hù)與可持續(xù)發(fā)展提供科技支撐。
談到這場(chǎng)由人工智能驅(qū)動(dòng)的科研范式變革,王堅(jiān)表示,我們來到了一個(gè)由計(jì)算、數(shù)據(jù)驅(qū)動(dòng)和基于大模型的協(xié)同密不可分的時(shí)代,AI對(duì)于生成科學(xué)假設(shè)、進(jìn)行科學(xué)實(shí)驗(yàn)、分析科學(xué)數(shù)據(jù)、發(fā)現(xiàn)科學(xué)規(guī)律等都發(fā)揮著革命性作用,大大提升了科學(xué)研究的速度、廣度、深度和精度,呈現(xiàn)著蓬勃發(fā)展的勢(shì)頭。