通用腦機接口時代要來了?跨尺度腦基礎模型CSBrain真正讀懂腦信號
一、腦機接口困境:從「 專才」到「通才」的范式轉變需求
腦機接口(Brain-Computer Interface, BCI)被視為連接人類智能與人工智能的終極界面。要真正實現這一愿景,核心在于高精度的腦信號解碼,即讓通用 AI 模型能夠真正「讀懂」復雜多變的腦活動。
近年來,腦電信號(EEG)解碼技術促進了從醫療診斷(如癲癇檢測、精神障礙診斷)到認知增強(如疲勞監測、情緒識別),再到肢體輔助和言語解碼等一系列應用。
然而,長期以來,這一領域主要依賴于任務特定的深度學習模型,如 CNN、RNN 和 GNN 等。這些模型在特定數據集和任務上表現優異,卻存在致命短板:缺乏通用性與跨任務遷移能力。模型往往需要在每個新任務上從零開始,難以適應復雜、多樣、動態的人腦信號。這導致模型既無法實現規模化,也很難從海量且異構的腦電數據中學到真正通用、可遷移的神經表征,使得當下的 BCI 系統仍停留在彼此孤立的「專才」應用階段,難以支撐通用腦機接口對多種認知和運動任務的靈活、穩定解碼需求。
二、基礎模型賦能:跨尺度、結構感知的腦基礎模型 CSBrain
受自然語言處理和計算機視覺領域基礎模型(如 GPT、InternLM、SAM、DINO 等)成功的啟發,AGI 的浪潮正在席卷科學計算。
研究人員開始思考:能否構建一個強大的腦基礎模型(Brain Foundation Model),像理解語言或圖像一樣,去理解各種任務下的腦信號,從而為通用 BCI 系統提供底層的認知操作系統?
然而,移植現有范式面臨挑戰:腦信號具備獨特的跨尺度時空結構,即神經活動的時間和空間尺度在不同任務間差異巨大,從瞬時爆發到慢波震蕩,從局部激活到全腦協作。傳統的尺度無關的密集建模范式并不能有效捕捉內在神經結構。

為解決上述挑戰,來自上海人工智能實驗室、中山大學和香港中文大學的聯合研究團隊提出了 CSBrain (Cross-scale Spatiotemporal Brain foundation Model),其核心思想是構建一個跨尺度結構感知的架構,將神經生理學先驗融入模型設計。論文被接收為 NeurIPS 2025 Spotlight。

- 論文標題:CSBrain: A Cross-scale Spatiotemporal Brain Foundation Model for EEG Decoding
- 論文地址:https://arxiv.org/abs/2506.23075
- Github:https://github.com/yuchen2199/CSBrain
CSBrain 引入了兩大核心創新模塊,并采用交替堆疊的方式,漸進式地整合跨尺度的時空依賴:
1. 跨尺度時空標記化(CST)
CST 模塊通過多尺度時空卷積核在腦電信號的局部時間窗口和解剖腦區內,分別提取多尺度的時間和空間特征,時空聚合后生成兼具粗、細粒度的腦電 tokens。
此外,CST 還設計了指數衰減的維度分配策略,即小尺度核分配高維度以保留細節,大尺度核分配低維度捕獲上下文,從而在神經表征能力與計算效率之間取得平衡。
2. 結構化稀疏注意力(SSA)
SSA 模塊針對 CST 輸出的結構化 token,引入窗口間注意力和區域間注意力,捕獲長程時序依賴的同時建模跨腦區交互。通過這種稀疏注意力設計,計算復雜度從 O (N2) 降低至 O (N?k),同時也有效抑制腦電噪聲帶來的虛假關聯。

CSBrain 采用掩碼自預測的自監督預訓練范式,并基于 TUEG 數據集中超過 9000 小時的腦電信號數據完成了大規模預訓練。
三、實驗亮點與分析
研究團隊在 11 個代表性腦解碼任務、16 個公共數據集上進行了全面驗證,涵蓋了運動想象、情緒識別、癲癇檢測、睡眠分期、語音想象等關鍵 BCI 應用場景。
結果顯示,CSBrain 在幾乎所有任務和評估指標上均達到了當前最強性能。在 11 項任務的平均結果中,相較于當前 SOTA 模型實現 3.35% 的整體性能提升。
CSBrain 在高挑戰性解碼任務上的表現尤其出色,在運動想象任務(BCIC-IV-2a)上的準確率指標較 SOTA 模型提升 5.2%,在癲癇檢測任務(Siena)上的 AUC-PR 指標提升 7.6%。這些優勢得益于跨尺度建模能更好地適配任務特定的神經模式,從而顯著增強模型的泛化與魯棒性。

這些實驗結果驗證了 CSBrain 融合跨尺度時空建模范式和預訓練腦基礎模型的有效性,為多達 11 類 BCI 應用提供了有效支撐。這不僅為腦基礎模型提供了新的架構設計思路,也為下一代腦機接口的設計打開了全新可能。
未來隨著數據規模的擴展與計算能力的提升,腦基礎模型的研究有望在更廣泛的腦—AI 融合場景中發揮更大作用,加速腦科學與人工智能的深度交匯,推動新一代腦機接口的加速應用。






























