国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

大模型能否為不同硬件平臺生成高性能內核?南大、浙大提出跨平臺內核生成評測框架MultiKernelBench

人工智能 新聞
近日,南京大學與浙江大學聯合推出全新開源評測框架 MultiKernelBench,打破平臺、維度與擴展性的限制,為 LLM 驅動的高性能內核生成提供了新的測評標準。

在深度學習模型的推理與訓練過程中,絕大部分計算都依賴于底層計算內核(Kernel)來執行。計算內核是運行在硬件加速器(如 GPU、NPU、TPU)上的 “小型高性能程序”,它負責完成矩陣乘法、卷積、歸一化等深度學習的核心算子運算。

當前,這些內核通常由開發者使用 CUDA、AscendC、Pallas 等硬件專用并行編程語言手工編寫 —— 這要求開發者具備精湛的性能調優技巧,并對底層硬件架構有深入理解。

近年來,大語言模型(LLM)在代碼生成領域的突破,使 “自動生成高性能深度學習內核” 成為新的研究熱點。KernelBench、TritonBench 等評測基準相繼出現,主要聚焦于評估 LLM 在 NVIDIA GPU 內核生成上的表現。

已有研究表明,現有 LLM 已具備一定的 GPU 內核生成能力。例如,英偉達工程師基于 DeepSeek-R1 設計了一套工作流程,在簡單的 CUDA 內核生成任務中,該流程生成的內核在數值上全部正確,達到了 100% 的通過率。

然而,當前 AI 加速器架構日趨多樣(如 NVIDIA GPU、華為昇騰 NPU、Google TPU、Intel GPU 等),其底層內核語言差異顯著。現有評測基準普遍存在平臺覆蓋單一、評估維度粗糙、可擴展性不足等局限。在此背景下,關鍵問題浮現:大模型在 CUDA 生態下的優勢能否有效遷移至異構平臺?我們距離自動化生成高性能計算內核究竟還有多遠?

針對這些問題,近日,南京大學與浙江大學聯合推出全新開源評測框架 MultiKernelBench,打破平臺、維度與擴展性的限制,為 LLM 驅動的高性能內核生成提供了新的測評標準。

  • 論文鏈接:https://arxiv.org/pdf/2507.17773
  • 代碼鏈接:https://github.com/wzzll123/MultiKernelBench

MultiKernelBench 提出了一個開放評測場景:在 GPU、NPU、TPU 等多平臺上,LLM 自動生成高性能深度學習內核,并在真實設備中完成編譯、運行與性能驗證。它首次跨越單一硬件生態,推動 LLM 從 “單平臺選手” 邁向 “全能型選手”。

值得注意的是,MultiKernelBench 的設計充分考慮了算子多后端的可擴展性。例如,Intel 工程師基于該框架高效地實現了 Intel GPU 的適配。

MultiKernelBench 是如何構建的?

 為了確保任務覆蓋全面且具有可擴展性,研究團隊設計了一套模塊化評測體系,包含四大核心特性:

1、 跨硬件平臺支持

首批覆蓋三大主流架構:

  • NVIDIA GPU(CUDA / Triton)
  • 華為昇騰 NPU(AscendC)
  • Google TPU(Pallas)

通過統一 Backend 接口與裝飾器機制,實現無需修改核心邏輯即可快速接入新平臺。

論文作者后續計劃逐步擴展對不同 GPU 和 NPU 廠商架構的支持,同時也誠邀各廠商參與開源生態的共建。

2、 細粒度任務體系

 在 Stanford KernelBench 基礎上重構分類框架,覆蓋 14 類核心深度學習算子(卷積、歸一化、優化器、稀疏計算等),不僅繼承了 250 個經典任務,還新增 35 個未被現有基準覆蓋的關鍵算子,全面反映 LLM 在不同算子類型上的生成能力。

3、 端到端自動化評測

構建標準化流程:內核生成 → 編譯 → 硬件執行 → 性能分析,確保在真實硬件環境中完成全流程驗證。

4、 類別感知 One-shot 提示策略

針對不同算子類別動態選取典型樣例作為上下文提示,顯著提升生成代碼的語義相關性與功能正確性,尤其在 AscendC、Pallas 等訓練語料稀缺的平臺上效果顯著。

此外,MultiKernelBench 提供插件式提示模板系統,方便研究者探索多樣化的提示工程策略。

對比現有基準,MultiKernelBench 帶來三大突破:

  • 平臺覆蓋更廣:打破對單一生態的依賴,真正實現跨 GPU / NPU / TPU 的統一評測。
  • 評估維度更細:任務分類粒度精細化,可定位 LLM 在不同算子類型上的優勢與短板。
  • 擴展性更強:模塊化架構與統一接口設計,使其能夠伴隨 AI 硬件生態快速演進。

多模型實測,模型表現如何?

基于 MultiKernelBench,評估了包括 GPT-4o、Claude、DeepSeek-V3、Qwen 等在內的 7 個主流大模型,參數規模涵蓋 32B ~ 681B。

評估指標包括:

  • Compilation@k:生成代碼是否能成功編譯 
  • Pass@k:是否輸出功能正確的結果 
  • SpeedUp@k:運行時是否實現性能優化

實測結果顯示:

  • Claude-4-Sonnet 在整體評測中表現最佳;推理模型表現優異。
  • CUDA 平臺的 Kernel 執行通過率顯著高于 Pallas 與 AscendC,反映出當前 LLM 對 CUDA 更具適應性。
  • 類別感知式 Prompting 明顯優于通用模板,尤其在 AscendC 等訓練語料較少的平臺上,能顯著提升生成效果與成功率。

展望與未來計劃

MultiKernelBench 的評測結果表明,即便是當前最先進的大語言模型(LLM),在多平臺高性能內核生成任務中仍存在明顯短板:在非 CUDA 平臺上的成功率顯著下降,生成代碼的性能也普遍落后于手工優化版本。

未來,論文作者希望與社區共同推進 MultiKernelBench 的演進,重點探索以下方向:

  • 更智能的提示策略:利用已有的插件式提示模板系統,開發反饋式、文檔增強等新型提示方法,提升低資源平臺的生成質量。
  • 跨平臺協同生成:實現多平臺版本的同步生成與優化思路共享,增強跨架構泛化能力。
  • 支持更多硬件后端:與社區合作接入更多新平臺,進一步覆蓋異構計算全景。

目前,MultiKernelBench 的全量數據集、框架代碼與評測流程已全部開源,歡迎研究者與工程師提出新方法、貢獻平臺支持,共同推動多平臺高性能內核自動生成的發展。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-04-03 09:27:44

2025-07-23 10:07:31

2024-01-19 12:12:17

騰訊SecBenc

2014-04-11 10:06:55

微軟SQL Server BI

2024-08-06 11:30:00

2023-07-27 13:58:19

2011-12-13 20:07:26

跨平臺工具

2009-12-03 19:02:05

Linux

2024-09-12 12:46:36

2025-06-03 09:25:00

XNet-DNN大語言模型神經網絡

2025-06-06 09:15:00

2025-12-22 08:49:00

AI圖像生成模型

2011-03-18 15:22:25

Linux內核2.6.38

2015-06-02 09:54:12

云服務大數據平臺云平臺

2012-07-23 10:23:25

CloudStackOpenStack云平臺

2024-04-07 11:40:40

Android框架

2025-11-24 08:46:00

AI模型數據

2023-08-03 10:59:49

人工智能

2021-08-12 16:42:09

WireGuardWindows內核NT

2025-01-03 10:30:00

點贊
收藏

51CTO技術棧公眾號

成人欧美视频在线| 99热免费精品在线观看| 人妻夜夜添夜夜无码av| 欧美精品性视频| 亚洲在线中文字幕| 国产精品久久久久久影院8一贰佰| 在线视频尤物| 国产伦精品一区二区三区| 日韩成人小视频| 91在线精品秘密一区二区| 日韩av三区| 2024最新电影免费在线观看| 免费看一级大黄情大片| 999国内精品视频在线| 亚洲成人网在线| 欧美国产激情二区三区| 日韩成人精品一区二区| 最新欧美色图| 最新黄色片网站| 欧美一区二区三区爽大粗免费| 国产精品福利片| 宅男66日本亚洲欧美视频| 色伦专区97中文字幕| 日韩在线欧美在线| 久久久久国产精品www| 国产精品第三页| 国产精品电影观看| 国产极品精品在线观看| 国产免费观看久久黄| 日韩美女免费观看| 国产精品99久久久久久人| 66m—66摸成人免费视频| 日韩一区二区三区免费观看| 五月婷婷激情综合网| 亚洲免费av高清| caoporn国产精品| 免费成人美女在线观看.| 国产精品一在线观看| 日韩三区免费| 欧美18av| 岛国av免费在线观看| 黄色片网站在线观看| 国产香蕉视频在线看| 亚洲久久中文字幕| av动漫在线看| 黄色一级片黄色| 特级黄色录像片| 国产精品视频入口| 高清不卡一区二区三区| 3d蒂法精品啪啪一区二区免费| 欧美国产视频一区二区| 久久精品久久久久久国产 免费| 日韩欧美久久一区| 欧美变态凌虐bdsm| 欧美sm极限捆绑bd| 精品久久久久香蕉网| 欧美zozozo| 亚洲精品网址在线观看| 亚洲精品久久7777777| 欧美日韩视频在线| 欧美性xxxx极品高清hd直播 | av在线不卡免费观看| 日韩mv欧美mv国产网站| 黄色成人小视频| 国产精品99精品一区二区三区∴| 久久精品国产亚洲5555| 欧美精品一区二区三区中文字幕 | 亚洲自拍偷拍一区| 国产精品视频导航| 成人区精品一区二区| 日本在线视频站| 欧美日韩国产在线一区| 欧美视频精品在线| 亚洲激情第一页| 霍思燕三级露全乳照| 激情久久免费视频| 有码一区二区三区| 国产成人精品一区二区| 黄色视屏免费在线观看| 国产精品中文欧美| 欧美午夜性色大片在线观看| 亚洲无人区一区| 国产欧美精品一区二区三区介绍| 日韩爱爱小视频| 伊人久久大香线蕉av不卡| 成人18视频在线播放| 亚洲欧美国产精品专区久久| 粉嫩av四季av绯色av第一区 | 国产在线精品一区二区三区》| 国产a∨精品一区二区三区不卡| 99国产精品久久久久久久久久久| 香蕉av福利精品导航| 国产深夜精品福利| 国产欧美日韩一区| 人人澡人人爽| 性爽视频在线| 亚洲毛片av| 粉嫩av一区二区三区免费野| www.日韩欧美| 潘金莲一级淫片aaaaa免费看| 欧美女同网站| 亚洲丝袜美腿一区| 久久综合久久综合久久| 91精品中文字幕一区二区三区| 国产精品欧美亚洲777777| 99热热99| 亚洲人挤奶视频| 久久综合九色综合欧美98| 日韩精品极品毛片系列视频| 日本精品一区二区| 黄色小网站在线观看| 亚洲日本欧美| 一本色道**综合亚洲精品蜜桃冫| 奇米成人av国产一区二区三区| 成人精品小视频| 成人盗摄视频| 亚洲六月丁香色婷婷综合久久| 欧美精品久久久久| 三级在线免费看| 99精品国产一区二区三区2021| 国产精品你懂的在线欣赏| 高清欧美性猛交xxxx黑人猛交| 中文字幕国内自拍| 国产欧美日韩精品一区二区三区| 亚洲综合色视频| 97免费资源站| 色呦呦网站在线观看| 国产99久久久国产精品潘金| 日韩一级裸体免费视频| 已婚少妇美妙人妻系列| 亚洲午夜天堂| 亚洲国产精品二十页| 国产精品永久入口久久久| 久久精品蜜桃| 久久机这里只有精品| 欧美一区二三区| 国产高清中文字幕在线| 国产精品狼人久久影院观看方式| 国产99午夜精品一区二区三区| 三级中文字幕在线观看| 中文字幕五月欧美| 亚洲欧美一区二区原创| 国产毛片一区二区三区| 亚洲欧洲一区二区三区在线观看| 免费在线黄色av| 国产自产高清不卡| 91九色国产社区在线观看| 桃花岛tv亚洲品质| 欧美日韩国产另类一区| 美女网站色免费| 国产美女精品一区二区三区| 91亚洲精品一区| 只有精品亚洲| 欧美一区二区啪啪| 国产视频三区| 久久久天堂av| 一区二区三区四区视频在线| 婷婷久久一区| 久久人人97超碰精品888| 深夜成人在线| 欧美区一区二区三区| 免费观看一二区视频网站| 99re热视频精品| 中文字幕日韩一区二区三区不卡| 国产综合婷婷| 91高跟黑色丝袜呻吟在线观看| 9l亚洲国产成人精品一区二三| 中文国产成人精品| www在线看| 欧美日韩一级二级三级| 精品视频一二区| 精品成人av一区| 91短视频在线| 91亚洲国产高清| 一区二区三区视频免费在线观看| 日本片在线看| 国产精品嫩草影院av蜜臀| 韩国成人一区| 精品午夜视频| 色哟哟亚洲精品| 极品粉嫩饱满一线天在线| 国内精品久久久久久99蜜桃| 一区二区三区在线视频播放| 极品尤物一区二区三区| 亚洲人成伊人成综合图片| 久久精品国产视频| 欧美日韩影视| 7799精品视频| av在线二区| 色老汉av一区二区三区| 天堂视频中文在线| 欧美日韩亚洲一区二区三区| 国产三区在线观看| 欧美成人a在线| 91在线观看| 国产欧美日韩在线看| 蜜臀av性久久久久蜜臀av| 欧美wwwsss9999| 91福利小视频| 国产情侣av自拍|