科技日報記者 吳長鋒 洪敬譜
記者7日從安徽省量子計算工程研究中心獲悉,本源量子計算科技(合肥)股份有限公司、合肥綜合性國家科學中心人工智能研究院等機構聯合攻關,在我國超導量子計算機“本源悟空”真機上,實現十億級參數AI大模型微調任務的全球首次運行。
實驗結果顯示,在參數量減少76%的前提下,訓練效果反而提升8.4%。這一成果不僅驗證了量子計算助力實現大模型輕量化的可行性,更為破解大模型“算力焦慮”開辟了新路徑。
微調是指在通用大模型(如DeepSeek、Qwen)的基礎上,通過進一步訓練特定領域數據,使其適應醫療診斷、金融風控等專業場景。傳統低秩微調面臨性能瓶頸、泛化能力有限等問題,量子計算憑借其疊加態和糾纏態特性可同時探索海量參數組合,可提升大模型微調的效率。
“就好比給經典模型裝上了‘量子引擎’,讓兩者協同發力。”本源量子副總裁竇猛漢表示,團隊創新設計了“量子加權張量混合參數微調”,通過量子計算特性實現智能“微調”——將模型權重轉化為量子神經網絡與張量網絡混合架構,前者通過量子門操作提取高維非線性特征,張量網絡則壓縮參數規模。
合肥綜合性國家科學中心人工智能研究院副研究員陳昭昀說:“這是量子計算首次‘真機實戰’大模型任務,證明現有硬件已能初步支撐大模型微調。”
在“本源悟空”的量子芯片上,單批次數據可生成數百個量子任務并行處理。實驗數據顯示,優化后的模型在心理咨詢對話數據集(CPsyCountD)上訓練損失降低15%,數學推理任務(R1-Distill-SFT)的嚴格準確率從68%提升至82%。
據介紹,“本源悟空”是目前我國先進的可編程、已交付超導量子計算機,已為全球139個國家超2300萬人次提供量子算力云服務,完成35萬個量子運算任務,涵蓋流體動力學、金融、生物醫藥等多個行業領域。此外,該量子計算機還成功完成全球最大規模的量子計算流體動力學仿真,并接入金融量子云實驗平臺,用于探索金融領域更高效的問題解決方案。