各有關單位:
國家自然科學基金委員會現發布可解釋、可通用的下一代人工智能方法重大研究計劃2025年度項目指南,請申請人及依托單位按項目指南所述要求和注意事項申請。
可解釋、可通用的下一代人工智能方法重大研究計劃2025年度項目指南
可解釋、可通用的下一代人工智能方法重大研究計劃面向人工智能發展國家重大戰略需求,以人工智能的基礎科學問題為核心,發展人工智能新方法體系,促進我國人工智能基礎研究和人才培養,支撐我國在新一輪國際科技競爭中的主導地位。
一、科學目標
本重大研究計劃面向以深度學習為代表的人工智能方法魯棒性差、可解釋性差、對數據的依賴性強等基礎科學問題,挖掘機器學習的基本原理,發展可解釋、可通用的下一代人工智能方法,并推動人工智能方法在科學領域的創新應用。
二、核心科學問題
本重大研究計劃針對可解釋、可通用的下一代人工智能方法的基礎科學問題,圍繞以下三個核心科學問題開展研究。
(一)深度學習的基本原理。
深入挖掘深度學習模型對超參數的依賴關系,理解深度學習背后的工作原理,建立深度學習方法的逼近理論、泛化誤差分析理論和優化算法的收斂性理論。
(二)可解釋、可通用的下一代人工智能方法。
通過規則與學習結合的方式,建立高精度、可解釋、可通用且不依賴大量標注數據的人工智能新方法。開發下一代人工智能方法需要的數據庫和模型訓練平臺,完善下一代人工智能方法驅動的基礎設施。
(三)面向科學領域的下一代人工智能方法的應用。
發展新物理模型和算法,建設開源科學數據庫、知識庫、物理模型庫和算法庫,推動人工智能新方法在解決科學領域復雜問題上的示范性應用。
三、2025年度資助研究方向
(一)培育項目。
圍繞核心科學問題,以總體科學目標為牽引,擬以培育項目的方式資助探索性強、選題新穎、前期研究基礎較好的申請項目,研究方向如下:
1. 神經網絡的新架構和新的預訓練或自監督學習方法。
針對圖像、視頻、圖、流場等數據,發展更高效的神經網絡新架構、預訓練或自監督學習方法,并在真實數據集上進行驗證。
2. 深度學習的基礎理論。
研究神經網絡的函數空間理論及誤差分析。研究神經網絡非線性訓練過程中的重要現象,包括頓悟(grokking)、穩定性邊緣(edge of stability)、損失尖峰(loss spike)和凝聚現象(condensation),分析損失景觀的嵌入結構、訓練超參數、凝聚、正則化技術等對Transformer、Mamba等架構的樣本效率、分布外檢測、泛化能力、推理性能的影響。
3. 大模型的基礎問題。
研究多任務、多數據、大模型的基礎問題,包括但不限于大模型的表示理論、泛化理論、樣本效率、大模型訓練的穩定性、標度率(scaling law)、涌現等現象;研究大模型的記憶災難(curse of memory)問題;研究大模型的思維鏈(Chain of Thoughts)、多步推理、上下文學習(In-Context learning)、推理外推能力(如length generalization)等的機制。
4. 以數據為中心的機器學習。
針對大模型數據側的獲取成本和效率問題,剖析數據生成模型的優化與泛化過程,加速生成模型的訓練和推理;針對訓練數據的質量和數量問題,設計多樣化和高質量的數據生成方法,提出高效的數據選擇和配比策略,探索數據與模型協同迭代優化的方式,加速通用大模型的訓練。
5. 科學領域的人工智能方法與理論。
針對典型的科學領域應用場景,如核聚變、藥物研發、材料設計、電子多體等問題,發展人工智能與物理、化學、生物等基礎理論和模型融合的方法,建立可通用的跨尺度人工智能輔助計算理論和方法,解決典型復雜正反問題。
(二)重點支持項目。
圍繞核心科學問題,以總體科學目標為牽引,擬以重點支持項目的方式資助前期研究成果積累較好、對總體科學目標在理論和關鍵技術上能發揮推動作用、具備產學研用基礎的申請項目,研究方向如下:
1.融合邏輯和深度學習的推理方法。
通過融合邏輯方法和深度學習方法,提升人工智能系統的可靠性與處理復雜推理問題的能力。通過構建形式化數學數據庫,優化機器翻譯技術與證明算法,實現高度自動化的定理證明,建立高度嚴謹的推理模型。
2. 融合物理與人工智能的幾何生成。
融合物理仿真與深度學習方法,實現面向多物理場微幾何結構的基礎生成模型;通過建立形式化與BREP表示的計算機輔助幾何(CAD)模型數據庫,實現功能描述準確、高精度CAD模型自動生成,構建高質量的幾何資產;增強從CAD模型生成四面體、四邊形、高階網格的魯棒性,實現物理仿真穩定性與精度的提升。
3. 新一代腦啟發的人工智能。
針對生物神經元的節能特性與多樣化結構,在生物神經元與人工神經元之間建立簡潔高效的映射,使人工神經元具有生物神經元的能量優化與樹突非線性計算功能,并提出統一的能量優化算法框架。結合神經元網絡的連接結構與腦區特性,設計生物神經元特性約束和基于時空信息嵌入的人工神經網絡模型,實現記憶、決策等高級認知功能。實現不少于3種生物與人工神經元的映射及不少于3種樹突計算功能,與現有映射相比,實現精度、性能與可解釋性的提升。
4.類人認知學習框架。
探索類人認知學習框架,通過智能體主動感知和交互、模型自主學習和迭代更新,提升系統的智能化水平,解決具身智能體在復雜物理環境下的交互決策難題,為因果模型構建、物理常識生成等具身智能任務提供支撐。
5.物理過程驅動的多智能體仿真場景可信生成。
構建基于物理原理驅動的場景模型,實現高度逼真的環境動態模擬;整合多模態信息,增強智能體與環境的交互,確保仿真實體與現實世界的特性和行為相匹配;建立完善的仿真數據可信度評估體系,確保仿真場景的可靠性,為復雜系統研究和決策提供堅實的虛擬基礎。
6. 可解釋的人工智能方法及其在化學反應復雜體系中的應用。
發展基于深度學習與物理模型融合的可解釋人工智能方法,解析和構建化學反應網絡,揭示復雜化學反應體系的微觀機理與表界面作用規律,推動可解釋的人工智能方法在能源催化、合成化學和合成生物學等重要領域的落地應用。
7. 人工智能驅動的虛擬細胞研究。
基于多組學數據和人工智能方法,發展虛擬細胞技術,模擬細胞動態生命過程,解析細胞互作原理,預測生物體對擾動的復雜響應。具體包括:1)虛擬單細胞:針對酵母、細胞系等典型情景,通過多組學數據構建多尺度基因調控與信號通路網絡模型,動態預測細胞行為,實現合成生物學或藥物篩選應用;2)虛擬生物體:對線蟲、胚胎等典型場景,通過影像學和組學數據,構建多細胞相互作用關系和時空動態變化模型,揭示生物體的生物學機制。
8. 罕見病診斷決策大模型。
建立大規模罕見病臨床和遺傳信息數據庫,覆蓋基因和臨床表現等多維度信息,結合多模態數據,構建可解釋的罕見病診斷決策大模型,為罕見病診斷和治療提供關鍵依據。
9. 基于多模態大模型的耐受極端環境生物元件設計。
基于極端環境微生物數據,構建融合序列、結構與功能的蛋白質和核酸序列多模態預訓練大模型;分析重要生物元件與環境適應性、代謝功能等的聯系,構建元件對極端環境適應度的預測模型;設計開發耐受高溫、高壓、極端pH的蛋白質和核酸等功能元件并接受濕實驗驗證,推動其在工業、醫藥等領域的產業化應用落地。
(三)集成項目。
本年度擬遴選具有重大應用價值和良好研究基礎的研究方向進行集成資助,研究方向如下:
1.記憶與推理分離、分層的通用大模型。
設計記憶與推理分離、分層的通用大模型新架構,構建推理數據集,研究大模型的基礎理論及訓練方法。具體包括:1)探索記憶與推理分離的模型架構,實現可擴展、可學習、高壓縮、分布式、分層的記憶存儲,設計存算高效的新型訓練方法,通過從頭預訓練大模型(不少于7B參數,1T Tokens)驗證新架構與新訓練方法的有效性;2)實現文本推理數據的自動提取,自動構建自然語言推理數據和形式化數學定理數據庫;3)闡明Next-Token Prediction訓練范式有效性的內在機制,研究超參數和模型復雜度等對大模型推理能力的影響。
2. 結構材料構效關系的構筑方法與應用。
研究結構材料成分、組織結構、工藝等知識編碼表示方法,發展符號回歸和深度學習等材料知識構筑算法,構建物理意義明確的典型結構材料構效關系數學表達式或經驗模型;研究可解釋材料特征工程、知識誘導高精度建模、材料因果推理等方法,挖掘多組元成分、復雜工藝、組織結構等對材料性能影響的內稟關系,建立材料數據庫、知識庫和工藝庫;面向新型結構材料研發和生產制造全過程,發展數據和知識雙驅動的方法,研發出2-3種高性能典型金屬結構材料,并通過工程中試驗證。
3. 融合環境-系統-模型的智能操作系統。
針對算力硬件和物理世界設備的泛化與智能化趨勢,打破物理環境與智能模型邊界,設計環境-系統-模型協同演進的方案。具體包括:1)研究操作系統、人工智能模型、物理環境三方面共同迭代演化方法,保障環境-系統-模型協同演進,相比分離演進整體性能提升50%以上;2)研究面向多樣化算力硬件和物理設備的分布式操作系統元架構,支撐不少于5種硬件和設備的高效抽象與適配,相比分離抽象利用效率提升30%以上;3)研究面向復雜物理環境的高可靠分布式數據傳輸與存儲底座,實現物理空間智能元素的韌性互聯與實時協同。
四、項目遴選的基本原則
(一)緊密圍繞核心科學問題,鼓勵基礎性和交叉性強的前沿探索,優先支持原創性研究。
(二)優先支持面向發展下一代人工智能新方法或能推動人工智能新方法在科學領域應用的研究項目。
(三)重點支持項目和集成項目應具有良好的研究基礎和前期積累,對總體科學目標有直接貢獻并發揮支撐作用。
五、2025年度資助計劃
擬資助培育項目約15項,直接費用資助強度約為40萬元/項,資助期限為3年,培育項目申請書中研究期限應填寫“2026年1月1日-2028年12月31日”;擬資助重點支持項目約6項,直接費用資助強度約為300萬元/項,資助期限為4年,重點支持項目申請書中研究期限應填寫“2026年1月1日-2029年12月31日”;擬資助集成項目約3項,直接費用資助強度為800-1200萬元/項,資助期限為4年,集成項目申請書中研究期限應填寫“2026年1月1日-2029年12月31日”。
六、申請要求及注意事項
(一)申請條件。
本重大研究計劃項目申請人應當具備以下條件:
1. 具有承擔基礎研究課題的經歷;
2. 具有高級專業技術職務(職稱)。
在站博士后研究人員、正在攻讀研究生學位以及無工作單位或者所在單位不是依托單位的人員不得作為申請人進行申請。
(二)限項申請規定。
執行《2025年度國家自然科學基金項目指南》“申請規定”中限項申請規定的相關要求。
(三)申請注意事項。
申請人和依托單位應當認真閱讀并執行本項目指南、《2025年度國家自然科學基金項目指南》和《關于2025年度國家自然科學基金項目申請與結題等有關事項的通告》中相關要求。
1. 本重大研究計劃項目實行無紙化申請。申請書提交日期為2025年3月1日-2025年3月15日16時。
(1)申請人應當按照科學基金網絡信息系統中重大研究計劃項目的填報說明與撰寫提綱要求在線填寫和提交電子申請書及附件材料。
(2)本重大研究計劃旨在緊密圍繞核心科學問題,對多學科相關研究進行戰略性的方向引導和優勢整合,成為一個項目集群。申請人應根據本重大研究計劃擬解決的核心科學問題和項目指南公布的擬資助研究方向,自行擬定項目名稱、科學目標、研究內容、技術路線和相應的研究經費等。
(3)申請書中的資助類別選擇“重大研究計劃”,亞類說明選擇“培育項目”、“重點支持項目”或“集成項目”,附注說明選擇“可解釋、可通用的下一代人工智能方法”,受理代碼選擇T01,根據申請的具體研究內容選擇不超過5個申請代碼。
培育項目和重點支持項目的合作研究單位不得超過2個,集成項目合作研究單位不得超過4個。集成項目主要參與者必須是項目的實際貢獻者,合計人數不超過9人。
(4)申請人在申請書起始部分應明確說明申請符合本項目指南中的資助研究方向,以及對解決本重大研究計劃核心科學問題、實現本重大研究計劃科學目標的貢獻。
如果申請人已經承擔與本重大研究計劃相關的其他科技計劃項目,應當在申請書正文的“研究基礎與工作條件”部分論述申請項目與其他相關項目的區別與聯系。
2. 依托單位應當按照要求完成依托單位承諾、組織申請以及審核申請材料等工作。在2025年3月15日16時前通過信息系統逐項確認提交本單位電子申請書及附件材料,并于在線提交本單位項目申請清單。
3. 其他注意事項。
(1)為實現重大研究計劃總體科學目標和多學科集成,獲得資助的項目負責人應當承諾遵守相關數據和資料管理與共享的規定,項目執行過程中應關注與本重大研究計劃其他項目之間的相互支撐關系。
(2)為加強項目的學術交流,促進項目群的形成和多學科交叉與集成,本重大研究計劃將每年舉辦1次資助項目的年度學術交流會,并將不定期地組織相關領域的學術研討會。獲資助項目負責人有義務參加本重大研究計劃指導專家組和管理工作組所組織的上述學術交流活動。
(四)咨詢方式。
交叉科學部交叉科學一處
聯系電話:010-6232 8382
學校科技處計劃項目科聯系方式:8830 2962,likeky@nwu.edu.cn
科技處
2025年1月27日