讓AI“開(kāi)竅”的藝術(shù):機(jī)器學(xué)習(xí)
首先,我們需要了解一下,什么是機(jī)器學(xué)習(xí)?
機(jī)器學(xué)習(xí)其實(shí)是人工智能的一個(gè)領(lǐng)域,本質(zhì)上是研究怎樣讓計(jì)算機(jī)像人一樣進(jìn)行學(xué)習(xí),獲取新的知識(shí)和技能,從而不斷改善自身的性能。
1.機(jī)器學(xué)習(xí)vs傳統(tǒng)編程
在傳統(tǒng)的編程過(guò)程中,計(jì)算機(jī)的工作主要是根據(jù)人們給它的數(shù)據(jù)和規(guī)則去進(jìn)行計(jì)算,最終得到答案。
程序員需要提前寫(xiě)好所有規(guī)則,讓計(jì)算機(jī)能夠依照規(guī)則進(jìn)行執(zhí)行,例如要讓計(jì)算機(jī)判斷圖片上的是貓還是狗,就得一條條寫(xiě)清楚貓和狗的特點(diǎn)(規(guī)則),但是這么一條條要全部寫(xiě)出來(lái),程序員表示臣妾做不到啊~
于是機(jī)器學(xué)習(xí)反其道而行,我們不告訴計(jì)算機(jī)具體的規(guī)則,而是給計(jì)算機(jī)大量的數(shù)據(jù),讓計(jì)算機(jī)在數(shù)據(jù)中總結(jié)規(guī)律,從而能去運(yùn)用規(guī)律。
我們給計(jì)算機(jī)看幾千張貓的照片,不用去給它解釋貓的耳朵有點(diǎn)像三角形,有胡須,還會(huì)喵喵叫等等,只需要計(jì)算機(jī)通過(guò)這些照片(數(shù)據(jù))去總結(jié)規(guī)律,自然就能認(rèn)識(shí)貓了。
圖片
傳統(tǒng)編程:程序員寫(xiě)規(guī)則→程序執(zhí)行→得到結(jié)果
機(jī)器學(xué)習(xí):給程序數(shù)據(jù)→程序?qū)W習(xí)→自動(dòng)得出規(guī)則
傳統(tǒng)編程和機(jī)器學(xué)習(xí)的它們的本質(zhì)區(qū)別就是:誰(shuí)在制定規(guī)則?
傳統(tǒng)編程適用于規(guī)則明確、邏輯清晰的問(wèn)題;機(jī)器學(xué)習(xí)適用于規(guī)則復(fù)雜、難以人工總結(jié)的場(chǎng)景。
2.機(jī)器學(xué)習(xí)的三大學(xué)習(xí)方式
機(jī)器學(xué)習(xí)的核心學(xué)習(xí)方式主要分為三類:監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)。
- 監(jiān)督學(xué)習(xí):有標(biāo)準(zhǔn)答案的刷題模式
監(jiān)督學(xué)習(xí)是機(jī)器學(xué)習(xí)中最常見(jiàn)的學(xué)習(xí)方式之一,核心邏輯和我們上學(xué)刷題如出一轍——有明確題目、有標(biāo)準(zhǔn)答案,學(xué)完就能直接“應(yīng)試”。
它的訓(xùn)練數(shù)據(jù)都帶有“標(biāo)簽”,相當(dāng)于“輸入內(nèi)容+正確結(jié)果”的配套套餐,模型就像認(rèn)真刷題的學(xué)生,通過(guò)反復(fù)學(xué)習(xí)海量“題目(輸入特征)+答案(標(biāo)簽)”,慢慢摸清兩者之間的對(duì)應(yīng)規(guī)律(映射關(guān)系),看到A特征,就能對(duì)應(yīng)B結(jié)果。
圖片
- 無(wú)監(jiān)督學(xué)習(xí):沒(méi)有標(biāo)準(zhǔn)答案的探索模式
與監(jiān)督學(xué)習(xí)不同,無(wú)監(jiān)督學(xué)習(xí)的輸入數(shù)據(jù)都是不帶標(biāo)簽的原始素材。
模型得像偵探一樣,自己從海量數(shù)據(jù)里找到隱藏的規(guī)律。
它的核心任務(wù)是挖掘數(shù)據(jù)的內(nèi)在結(jié)構(gòu):哪些數(shù)據(jù)長(zhǎng)得像可以歸為一類?數(shù)據(jù)的核心特征是什么?有沒(méi)有偏離常規(guī)的“異類”?
這些全都靠模型自主發(fā)現(xiàn)。
圖片
- 強(qiáng)化學(xué)習(xí):邊試錯(cuò)邊優(yōu)化的闖關(guān)升級(jí)模式
強(qiáng)化學(xué)習(xí)的核心是在互動(dòng)中成長(zhǎng),既沒(méi)有監(jiān)督學(xué)習(xí)的固定標(biāo)準(zhǔn)答案,也不像無(wú)監(jiān)督學(xué)習(xí)那樣沒(méi)有明確的目標(biāo),它更像是一款闖關(guān)游戲,模型就是“玩家”,環(huán)境則是“游戲地圖”,有明確的“通關(guān)目標(biāo)”,還有即時(shí)的獎(jiǎng)懲機(jī)制。
模型會(huì)在環(huán)境中不斷嘗試行動(dòng),做對(duì)了(靠近目標(biāo))能拿到獎(jiǎng)勵(lì),做錯(cuò)了(偏離目標(biāo)或遇到障礙)則得到懲罰。
通過(guò)一次次試錯(cuò),模型可以慢慢優(yōu)化行動(dòng)策略,從“處處碰壁”到“精準(zhǔn)避坑”,最終找到最快通關(guān)的最佳路徑。

3.機(jī)器學(xué)習(xí)的學(xué)習(xí)N步曲
機(jī)器學(xué)習(xí)的過(guò)程不是一步到位的,它也有一套明確步驟的成長(zhǎng)流程,要從菜鳥(niǎo)變大神,AI也需要經(jīng)歷“找素材、選方法、勤練習(xí)、驗(yàn)成果、上崗實(shí)戰(zhàn)”的完整路徑。
圖片
機(jī)器學(xué)習(xí)的核心過(guò)程可以概括為5步:數(shù)據(jù)準(zhǔn)備→模型選擇→訓(xùn)練優(yōu)化→評(píng)估測(cè)試→部署應(yīng)用,本質(zhì)是“用數(shù)據(jù)喂模型、用反饋調(diào)整模型、用實(shí)戰(zhàn)驗(yàn)證模型”的閉環(huán)。
1) 數(shù)據(jù)收集與預(yù)處理
學(xué)習(xí)的第一步就是收集學(xué)習(xí)素材(數(shù)據(jù)),如果模型要使用監(jiān)督學(xué)習(xí)方式訓(xùn)練,那么就要收集“輸入+標(biāo)簽”的配套數(shù)據(jù),如果模型要使用無(wú)監(jiān)督學(xué)習(xí)方式進(jìn)行訓(xùn)練,那么就要收集原始無(wú)標(biāo)簽的數(shù)據(jù)。
當(dāng)然,收集到的數(shù)據(jù)還需要進(jìn)一步的加工和整理(數(shù)據(jù)清洗、數(shù)據(jù)預(yù)處理等),以便模型能夠讀懂。
2) 選擇學(xué)習(xí)方式和算法
模型就像是一個(gè)學(xué)習(xí)工具,不同的模型,擅長(zhǎng)處理不同任務(wù)類型的問(wèn)題,比如有的擅長(zhǎng)處理圖片,有的擅長(zhǎng)處理文字。
模型的選擇取決于任務(wù)類型和數(shù)據(jù)特征,在訓(xùn)練時(shí),需要根據(jù)任務(wù)的性質(zhì)和數(shù)據(jù)的特點(diǎn)來(lái)選擇模型的學(xué)習(xí)方式和算法。
文檔君整理了一個(gè)表格,三種方式到底怎么選,一目了然~
學(xué)習(xí)方式 | 適用場(chǎng)景 | 常見(jiàn)算法 |
監(jiān)督學(xué)習(xí)(刷題) | 要預(yù)測(cè)“是/否”、“A類/B類”或具體數(shù)值,選它! |
|
無(wú)監(jiān)督學(xué)習(xí)(探索) | 要找相似組、簡(jiǎn)化數(shù)據(jù)、找異常,選它! |
|
強(qiáng)化學(xué)習(xí)(闖關(guān)) | 要AI自主決策、邊試錯(cuò)邊成長(zhǎng),選它! |
|
3) 訓(xùn)練優(yōu)化
模型訓(xùn)練是通過(guò)數(shù)據(jù)不斷優(yōu)化模型參數(shù)的過(guò)程。
當(dāng)把整理好的數(shù)據(jù)喂給模型,并選擇學(xué)習(xí)方式和算法后,還需要在模型的學(xué)習(xí)過(guò)程中不斷糾錯(cuò)調(diào)優(yōu),讓模型在訓(xùn)練數(shù)據(jù)上學(xué)習(xí)規(guī)律(監(jiān)督學(xué)習(xí)學(xué)“輸入-標(biāo)簽”的映射;無(wú)監(jiān)督學(xué)習(xí)挖數(shù)據(jù)結(jié)構(gòu);強(qiáng)化學(xué)習(xí)根據(jù)獎(jiǎng)懲情況調(diào)整策略)。
4) 評(píng)估測(cè)試
模型完成學(xué)習(xí)后也需要進(jìn)行模擬考試,看看模型能不能舉一反三。
在評(píng)估測(cè)試中,我們需要用沒(méi)學(xué)過(guò)的新數(shù)據(jù)測(cè)試模型效果,并用具體的指標(biāo)判斷效果(比如準(zhǔn)確率、誤差值等),如果測(cè)試結(jié)果不達(dá)標(biāo),那么模型還得繼續(xù)回爐重造。
5) 部署應(yīng)用
模型通過(guò)測(cè)試后就可以正式上崗了,把訓(xùn)練好的模型嵌入產(chǎn)品中(如APP、系統(tǒng)、機(jī)器人),模型就可以實(shí)時(shí)處理新數(shù)據(jù)了。
當(dāng)然,上崗之后的模型還需要持續(xù)監(jiān)控它的表現(xiàn),并用新數(shù)據(jù)迭代優(yōu)化模型,保證模型的長(zhǎng)期有效性。
























