国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

扔掉浮點(diǎn)數(shù)!1和-1組成的神經(jīng)網(wǎng)絡(luò),如何實(shí)現(xiàn)58倍加速?

發(fā)布于 2025-9-18 07:33
瀏覽
0收藏

2016年,深度學(xué)習(xí)領(lǐng)域還在熱衷于構(gòu)建越來越大的模型時(shí),一篇名為《Binarized Neural Networks》的論文橫空出世。

提出了一個(gè)看似瘋狂的想法:將神經(jīng)網(wǎng)絡(luò)中的權(quán)重和激活值全部壓縮到只有+1和-1兩種狀態(tài)。

扔掉浮點(diǎn)數(shù)!1和-1組成的神經(jīng)網(wǎng)絡(luò),如何實(shí)現(xiàn)58倍加速?-AI.x社區(qū)圖片

??論文地址:https://arxiv.org/pdf/1602.02830

這種“極致量化”的方法不僅讓模型大小縮小了32倍,還將耗電的浮點(diǎn)數(shù)乘法變成了高效的位運(yùn)算。

今天,就讓我們一起解讀這項(xiàng)改變深度學(xué)習(xí)部署格局的里程碑工作。

1.為什么需要“二值化”?

深度學(xué)習(xí)遭遇資源瓶頸,大模型遇到大麻煩

在深入論文之前,我們首先需要理解為什么研究者要探索如此極端的技術(shù)路徑。

傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的資源瓶頸

一個(gè)典型的現(xiàn)代神經(jīng)網(wǎng)絡(luò)可能包含數(shù)百萬甚至數(shù)十億個(gè)參數(shù)。

每個(gè)參數(shù)通常使用32位浮點(diǎn)數(shù)表示,每一次前向傳播都需要執(zhí)行數(shù)百萬次浮點(diǎn)乘加運(yùn)算。

扔掉浮點(diǎn)數(shù)!1和-1組成的神經(jīng)網(wǎng)絡(luò),如何實(shí)現(xiàn)58倍加速?-AI.x社區(qū)圖片

這種計(jì)算模式帶來三個(gè)核心問題:

  • 巨大的存儲(chǔ)需求:像ResNet-50這樣的經(jīng)典模型,權(quán)重文件就需要超過100MB的存儲(chǔ)空間
  • 高計(jì)算能耗:浮點(diǎn)數(shù)乘法在硬件上是極其耗電的操作
  • 內(nèi)存帶寬瓶頸:在許多情況下,從內(nèi)存中讀取數(shù)據(jù)比實(shí)際計(jì)算更加耗時(shí)和耗能

邊緣計(jì)算的崛起與挑戰(zhàn)

隨著物聯(lián)網(wǎng)和移動(dòng)設(shè)備的發(fā)展,我們?cè)絹碓叫枰谫Y源受限的環(huán)境(如手機(jī)、攝像頭、傳感器)中直接運(yùn)行AI模型,而不是依賴云端計(jì)算。

扔掉浮點(diǎn)數(shù)!1和-1組成的神經(jīng)網(wǎng)絡(luò),如何實(shí)現(xiàn)58倍加速?-AI.x社區(qū)圖片

這一趨勢(shì)使得模型壓縮和加速技術(shù)成為推動(dòng)AI在邊緣設(shè)備廣泛應(yīng)用的關(guān)鍵因素。

"二值神經(jīng)網(wǎng)絡(luò)"(Binarized Neural Networks, BNN) 正是在這種背景下應(yīng)運(yùn)而生,它代表了模型壓縮技術(shù)的極致追求。

2.如何實(shí)現(xiàn)這種“極致量化”?

二值化神經(jīng)網(wǎng)絡(luò)橫空出世,用1比特存儲(chǔ)權(quán)重

二值神經(jīng)網(wǎng)絡(luò)的核心思想非常簡(jiǎn)單粗暴:將傳統(tǒng)神經(jīng)網(wǎng)絡(luò)中32位浮點(diǎn)數(shù)的權(quán)重和激活值全部約束為只有兩個(gè)值:+1或-1。

扔掉浮點(diǎn)數(shù)!1和-1組成的神經(jīng)網(wǎng)絡(luò),如何實(shí)現(xiàn)58倍加速?-AI.x社區(qū)圖片

在硬件實(shí)現(xiàn)上,這兩個(gè)值可以用單個(gè)比特表示(0表示+1,1表示-1),這意味著原本需要32位表示的數(shù)據(jù)現(xiàn)在只需要1位。

理論上的內(nèi)存節(jié)省正好是32倍。理解BNN的一個(gè)好方法是將其與數(shù)字電子技術(shù)類比。

傳統(tǒng)神經(jīng)網(wǎng)絡(luò)像是使用模擬信號(hào)(連續(xù)值),而BNN則像是使用數(shù)字信號(hào)(離散值)。

雖然數(shù)字信號(hào)損失了一些信息,但它具有抗噪聲能力強(qiáng)、易于處理和傳輸?shù)膬?yōu)勢(shì)。

BNN看似簡(jiǎn)單的概念背后,隱藏著精妙的技術(shù)設(shè)計(jì)。如何用二值化的參數(shù)和激活值來訓(xùn)練和運(yùn)行神經(jīng)網(wǎng)絡(luò),并保持一定的精度。

其主要方法可以概括為以下幾點(diǎn):

二值化函數(shù)(Binarization Function)

首先,什么是二值化? 簡(jiǎn)單來說,就是通過一個(gè)符號(hào)函數(shù)(Sign Function)來處理數(shù)值:如果輸入大于等于0,輸出+1;否則輸出-1。

扔掉浮點(diǎn)數(shù)!1和-1組成的神經(jīng)網(wǎng)絡(luò),如何實(shí)現(xiàn)58倍加速?-AI.x社區(qū)圖片

但問題來了:這樣的二值化函數(shù)在反向傳播中幾乎不可導(dǎo),梯度無法傳播,網(wǎng)絡(luò)無法訓(xùn)練。這似乎是一個(gè)死結(jié)。

論文最精彩的部分就在于提出了直通估計(jì)器(Straight-Through Estimator, STE) 這一巧妙的解決方案。

扔掉浮點(diǎn)數(shù)!1和-1組成的神經(jīng)網(wǎng)絡(luò),如何實(shí)現(xiàn)58倍加速?-AI.x社區(qū)圖片

在前向傳播(Forward)中,使用一個(gè)非常簡(jiǎn)單的符號(hào)函數(shù)(Sign Function)來進(jìn)行二值化:

扔掉浮點(diǎn)數(shù)!1和-1組成的神經(jīng)網(wǎng)絡(luò),如何實(shí)現(xiàn)58倍加速?-AI.x社區(qū)


在反向傳播(Backward)中,Sign函數(shù)的導(dǎo)數(shù)幾乎處處為0,這會(huì)導(dǎo)致梯度無法傳播。STE巧妙地繞開了這個(gè)問題,它使用一個(gè)飽和的Hard Tanh函數(shù)的梯度來作為Sign函數(shù)的近似梯度:

扔掉浮點(diǎn)數(shù)!1和-1組成的神經(jīng)網(wǎng)絡(luò),如何實(shí)現(xiàn)58倍加速?-AI.x社區(qū)

這使得梯度可以有效地反向傳播回全精度的權(quán)重(見下一點(diǎn))。

訓(xùn)練高精度的“隱變量”(Latent Weights)

這是BNN訓(xùn)練的關(guān)鍵。BNNs在訓(xùn)練過程中并不直接更新二值化的權(quán)重(Binarized Weights)。相反,它維護(hù)一個(gè)全精度(float32)的權(quán)重副本,稱為“隱權(quán)重”或“真實(shí)權(quán)重”。

在每次前向傳播時(shí),將這個(gè)全精度權(quán)重二值化,得到 ,然后用  去計(jì)算。

扔掉浮點(diǎn)數(shù)!1和-1組成的神經(jīng)網(wǎng)絡(luò),如何實(shí)現(xiàn)58倍加速?-AI.x社區(qū)圖片

在反向傳播時(shí),梯度會(huì)通過STE更新到那個(gè)全精度的權(quán)重副本上。

這個(gè)全精度的權(quán)重積累了訓(xùn)練過程中所有的微小梯度更新,包含了網(wǎng)絡(luò)學(xué)習(xí)到的知識(shí),是訓(xùn)練過程的“主力軍”。

這樣,既享受了二值化帶來的計(jì)算效率,又保證了訓(xùn)練過程的穩(wěn)定性和最終模型的精度。

 二值化矩陣乘法與卷積的優(yōu)化

BNN的真正威力體現(xiàn)在推理過程中。當(dāng)權(quán)重和激活值都二值化后,最耗時(shí)的矩陣乘法和卷積操作可以被極大地簡(jiǎn)化。

扔掉浮點(diǎn)數(shù)!1和-1組成的神經(jīng)網(wǎng)絡(luò),如何實(shí)現(xiàn)58倍加速?-AI.x社區(qū)圖片

傳統(tǒng)的乘加運(yùn)算(MAC)被替換為位運(yùn)算(XNOR) 和位計(jì)數(shù)(Popcount)。

  • +1? 可以映射為比特0
  • -1? 可以映射為比特1

那么,兩個(gè)二值向量的點(diǎn)積 A · B? 就等價(jià)于:A XNOR B?,然后計(jì)算結(jié)果中 1 的位計(jì)數(shù),最后再做一個(gè)簡(jiǎn)單的線性變換。

由于XNOR和popcount操作在硬件上的速度極快、能耗極低,理論上可以獲得32倍的內(nèi)存節(jié)省和58倍的運(yùn)算加速(與float32相比)。

 第一層與最后一層的處理

當(dāng)然,BNN在實(shí)踐中也需要一些特殊處理,特別是在網(wǎng)絡(luò)的輸入層和輸出層。

對(duì)于輸入層,由于圖像的像素值通常是8位整數(shù)(0-255),不是二值的。直接二值化會(huì)帶來較大的信息損失。

因此,論文建議第一層的輸入保持為8位精度,只有第一層的權(quán)重是二值的。由于第一層計(jì)算量通常只占整個(gè)網(wǎng)絡(luò)的很小一部分,這對(duì)整體加速影響不大。

扔掉浮點(diǎn)數(shù)!1和-1組成的神經(jīng)網(wǎng)絡(luò),如何實(shí)現(xiàn)58倍加速?-AI.x社區(qū)圖片

而在輸出層中,最后一層通常產(chǎn)生用于分類的概率分布,也需要更高的精度。因此,最后一層的權(quán)重和激活也通常保持為高精度。

這種靈活的處理策略體現(xiàn)了論文作者的實(shí)用主義思想:在關(guān)鍵地方極端優(yōu)化,在必要地方保持精度。

3.實(shí)驗(yàn)結(jié)果與結(jié)論

精度與效率的平衡,在ImageNet上的表現(xiàn)

那么,BNN在實(shí)際數(shù)據(jù)集上的表現(xiàn)如何呢?

在MNIST、CIFAR-10、SVHN等中小型數(shù)據(jù)集上,BNN達(dá)到了與全精度網(wǎng)絡(luò)非常接近的精度,證明了方法的有效性。

扔掉浮點(diǎn)數(shù)!1和-1組成的神經(jīng)網(wǎng)絡(luò),如何實(shí)現(xiàn)58倍加速?-AI.x社區(qū)圖片

但在大型數(shù)據(jù)集ImageNet(使用AlexNet架構(gòu))上,BNN與全精度模型相比存在明顯的精度差距——Top-1準(zhǔn)確率下降約10%以上。

這表明極端二值化確實(shí)會(huì)帶來一定的信息損失,在處理復(fù)雜問題時(shí)尤為明顯。

但這換來的是模型大小縮小約32倍,推理速度顯著加快,能耗大幅降低。

扔掉浮點(diǎn)數(shù)!1和-1組成的神經(jīng)網(wǎng)絡(luò),如何實(shí)現(xiàn)58倍加速?-AI.x社區(qū)圖片

對(duì)于很多場(chǎng)景,這種 trade-off 是完全值得的。

畢竟,讓AI模型能夠在資源受限的設(shè)備上運(yùn)行,遠(yuǎn)比追求那幾個(gè)百分點(diǎn)的精度提升更為重要。

 結(jié)語 

二值神經(jīng)網(wǎng)絡(luò)的研究給我們帶來的不僅是具體的技術(shù)方案,更是一種思維方式的啟示:通過極致簡(jiǎn)化挑戰(zhàn)復(fù)雜問題。

在AI模型越來越龐大、越來越復(fù)雜的今天,BNN代表了一種反向的思考方向:如何用最少的資源實(shí)現(xiàn)最大的價(jià)值。這種思維不僅在技術(shù)上具有重要意義,也符合可持續(xù)發(fā)展的大趨勢(shì)。

本文轉(zhuǎn)載自???Fairy Girl???,作者:Fairy Girl

收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
奇米亚洲午夜久久精品| 91福利精品第一导航| 91一区二区在线观看| 99视频在线精品| 国产女人18水真多18精品一级做| 亚洲国产成人一区二区三区| 国产精品久久久久aaaa樱花| 亚洲欧美一区二区视频| 亚洲国产婷婷综合在线精品| 欧美性猛交xxxx免费看漫画 | 免费看欧美黑人毛片| 91动漫在线看| 成人两性免费视频| 精品国偷自产在线视频| 亚洲高清免费一级二级三级| 欧美另类videos死尸| 中文字幕一区电影| 天天插天天操天天射| 亚洲天堂二区| 91香蕉在线观看| 国产成人tv| 亚洲黄页一区| 99久久久无码国产精品| 欧美日韩国产综合新一区| 亚洲高清色综合| 欧美极品欧美精品欧美视频| 国产乱码精品一区二区三区卡 | 亚洲 中文字幕 日韩 无码| 精品国模一区二区三区| 国产精品久久久久久av公交车| 中文字幕在线网| а√在线中文在线新版| 狼人天天伊人久久| 国产一区二区在线观看视频| 亚洲午夜激情av| www.日本不卡| 色综合久久综合网| 五月天视频一区| 久久蜜臀中文字幕| 久久在线免费观看视频| 日韩欧美一区二区三区在线| 日韩电影在线免费看| 国产精品国模大尺度视频| 牛牛影视一区二区三区免费看| 亚洲永久精品大片| 亚洲国产日韩精品| 日本中文字幕不卡免费| 欧美激情99| 蜜桃一区二区三区在线观看| 国产精品污网站| 欧美色图在线观看| 青青草一区二区| 美国欧美日韩国产在线播放| 希岛爱理av一区二区三区| 在线看片黄色| mm1313亚洲国产精品美女| 国产精品视频免费观看| 日韩精品久久一区| 久久精品亚洲一区| 欧美劲爆第一页| 欧美日韩一区二区在线观看 | 欧美激情视频在线播放| 深夜福利成人| 成人性生交xxxxx网站| 亚洲午夜精品视频| 亚洲猫色日本管| 97人人模人人爽人人少妇| 国产丝袜精品视频| 免费av一区二区| 欧美 激情 在线| 一色桃子一区二区| 欧美一二三区| 欧美激情极品视频| 2023国产一二三区日本精品2022| 99精品视频免费观看视频| 嗯用力啊快一点好舒服小柔久久| 韩国av一区二区| av色综合网| 日本亚洲天堂| 欧美精品日本| 欧美亚洲免费在线一区| 久久影院午夜论| 97香蕉超级碰碰久久免费的优势| 色综合网站在线| 亚洲欧美另类中文字幕| 精品在线观看视频| 激情六月综合| 欧美日韩另类字幕中文| 国产精品久久久久久久久久久新郎| 亚洲丁香久久久| 日韩精品中文字幕在线不卡尤物| 国产精品2018| 日av在线播放中文不卡| 国内福利写真片视频在线| 理论片播放午夜国外| 里番在线播放| 在线中文免费视频| 99国产超薄肉色丝袜交足的后果| 久久久久久久国产精品影院| 欧洲av一区二区| 精品综合久久| 第一页在线观看| 日韩视频免费在线| 亚洲第一区中文字幕| 一区二区三区短视频| 国产精品成熟老女人| gogo大胆日本视频一区| 欧美韩国一区| 性色av香蕉一区二区| 亚洲一区二区三区高清| 欧美午夜性生活| 欧美一区二区三区视频| 高清精品视频| 亚洲看片网站| 亚洲午夜在线视频| 视频精品导航| 国产精品露出视频| 欧美国产国产综合| 欧亚在线中文字幕免费| 91久久在线播放| 久久综合色天天久久综合图片| 婷婷激情在线| 国产精品网址在线| 国产午夜亚洲精品羞羞网站| www视频在线观看| 99精品国产一区二区| 国产精品久99| 日韩毛片在线| 天堂一区二区三区| 在线中文字幕不卡| 久久爱www成人| 免费黄色福利视频| 亚洲国产黄色片| 99视频在线精品国自产拍免费观看| 爽爽爽爽爽爽爽成人免费观看| 美乳中文字幕| 亚洲精品一区二区在线| 欧美日韩一区二区国产| 蜜桃一级网站.| 69av在线播放| 成人国产精品视频| 国产色播av在线| 久久精品国产精品青草色艺| 亚洲va韩国va欧美va精品 | 国产精品男人的天堂| 99久久久久久| 日韩成人一区| 不卡av免费在线| 成人免费视频97| 在线电影中文日韩| 91免费国产视频网站| 亚洲精品一区二区三区在线| h视频在线播放| 国产综合久久久久久久久久久久| 欧美日韩激情视频一区二区三区| 欧美一级大片在线免费观看| 成人av中文字幕| 国产综合色区在线观看| 亚洲自拍偷拍二区| 精品乱人伦小说| 日韩午夜电影| 日本暖暖在线视频| 成人免费观看网站| 午夜久久电影网| 免费看av成人| 亚洲第一区第二区| 中文字幕免费在线视频| 欧美亚洲在线视频| 国产日产欧美一区| 欧美一级全黄| jizz欧美性11| 日韩美女视频在线观看| 国产日韩欧美电影| 你懂的一区二区三区| 国产精品㊣新片速递bt| 亚洲一区二区三区香蕉| 欧美偷拍一区二区| 日韩成人精品视频| 91久久久久久白丝白浆欲热蜜臀| 成人免费在线小视频| 2021久久精品国产99国产精品| 最近日韩中文字幕| 亚洲天天综合| 亚洲妇熟xxxx妇色黄| 欧美美女黄色网| 欧美精品18videosex性欧美| 亚洲综合一区二区| 亚洲神马久久| 亚洲成人av观看| 日本黄大片一区二区三区| 国产v综合ⅴ日韩v欧美大片| 欧美日韩亚洲国产一区| 国产模特精品视频久久久久| 美女网站在线看| 8x8x最新地址| 91成人免费在线观看| 精品免费99久久| 久久久91精品国产一区二区精品| 香蕉国产成人午夜av影院| 992tv在线影院|