讓AI“開(kāi)竅”的藝術(shù)：機(jī)器學(xué)習(xí)

作者：中興文檔 2025-11-26 01:22:00

在傳統(tǒng)的編程過(guò)程中，計(jì)算機(jī)的工作主要是根據(jù)人們給它的數(shù)據(jù)和規(guī)則去進(jìn)行計(jì)算，最終得到答案。程序員需要提前寫(xiě)好所有規(guī)則，讓計(jì)算機(jī)能夠依照規(guī)則進(jìn)行執(zhí)行，例如要讓計(jì)算機(jī)判斷圖片上的是貓還是狗，就得一條條寫(xiě)清楚貓和狗的特點(diǎn)（規(guī)則），但是這么一條條要全部寫(xiě)出來(lái)，程序員表示臣妾做不到啊！

首先，我們需要了解一下，什么是機(jī)器學(xué)習(xí)？

機(jī)器學(xué)習(xí)其實(shí)是人工智能的一個(gè)領(lǐng)域，本質(zhì)上是研究怎樣讓計(jì)算機(jī)像人一樣進(jìn)行學(xué)習(xí)，獲取新的知識(shí)和技能，從而不斷改善自身的性能。

1.機(jī)器學(xué)習(xí)vs傳統(tǒng)編程

在傳統(tǒng)的編程過(guò)程中，計(jì)算機(jī)的工作主要是根據(jù)人們給它的數(shù)據(jù)和規(guī)則去進(jìn)行計(jì)算，最終得到答案。

程序員需要提前寫(xiě)好所有規(guī)則，讓計(jì)算機(jī)能夠依照規(guī)則進(jìn)行執(zhí)行，例如要讓計(jì)算機(jī)判斷圖片上的是貓還是狗，就得一條條寫(xiě)清楚貓和狗的特點(diǎn)（規(guī)則），但是這么一條條要全部寫(xiě)出來(lái)，程序員表示臣妾做不到啊~

于是機(jī)器學(xué)習(xí)反其道而行，我們不告訴計(jì)算機(jī)具體的規(guī)則，而是給計(jì)算機(jī)大量的數(shù)據(jù)，讓計(jì)算機(jī)在數(shù)據(jù)中總結(jié)規(guī)律，從而能去運(yùn)用規(guī)律。

我們給計(jì)算機(jī)看幾千張貓的照片，不用去給它解釋貓的耳朵有點(diǎn)像三角形，有胡須，還會(huì)喵喵叫等等，只需要計(jì)算機(jī)通過(guò)這些照片（數(shù)據(jù)）去總結(jié)規(guī)律，自然就能認(rèn)識(shí)貓了。

圖片

傳統(tǒng)編程：程序員寫(xiě)規(guī)則→程序執(zhí)行→得到結(jié)果

機(jī)器學(xué)習(xí)：給程序數(shù)據(jù)→程序?qū)W習(xí)→自動(dòng)得出規(guī)則

傳統(tǒng)編程和機(jī)器學(xué)習(xí)的它們的本質(zhì)區(qū)別就是：誰(shuí)在制定規(guī)則？

傳統(tǒng)編程適用于規(guī)則明確、邏輯清晰的問(wèn)題；機(jī)器學(xué)習(xí)適用于規(guī)則復(fù)雜、難以人工總結(jié)的場(chǎng)景。

2.機(jī)器學(xué)習(xí)的三大學(xué)習(xí)方式

機(jī)器學(xué)習(xí)的核心學(xué)習(xí)方式主要分為三類：監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)。

監(jiān)督學(xué)習(xí)：有標(biāo)準(zhǔn)答案的刷題模式

監(jiān)督學(xué)習(xí)是機(jī)器學(xué)習(xí)中最常見(jiàn)的學(xué)習(xí)方式之一，核心邏輯和我們上學(xué)刷題如出一轍——有明確題目、有標(biāo)準(zhǔn)答案，學(xué)完就能直接“應(yīng)試”。

它的訓(xùn)練數(shù)據(jù)都帶有“標(biāo)簽”，相當(dāng)于“輸入內(nèi)容+正確結(jié)果”的配套套餐，模型就像認(rèn)真刷題的學(xué)生，通過(guò)反復(fù)學(xué)習(xí)海量“題目（輸入特征）+答案（標(biāo)簽）”，慢慢摸清兩者之間的對(duì)應(yīng)規(guī)律（映射關(guān)系），看到A特征，就能對(duì)應(yīng)B結(jié)果。

圖片

無(wú)監(jiān)督學(xué)習(xí)：沒(méi)有標(biāo)準(zhǔn)答案的探索模式

與監(jiān)督學(xué)習(xí)不同，無(wú)監(jiān)督學(xué)習(xí)的輸入數(shù)據(jù)都是不帶標(biāo)簽的原始素材。

模型得像偵探一樣，自己從海量數(shù)據(jù)里找到隱藏的規(guī)律。

它的核心任務(wù)是挖掘數(shù)據(jù)的內(nèi)在結(jié)構(gòu)：哪些數(shù)據(jù)長(zhǎng)得像可以歸為一類？數(shù)據(jù)的核心特征是什么？有沒(méi)有偏離常規(guī)的“異類”？

這些全都靠模型自主發(fā)現(xiàn)。

圖片

強(qiáng)化學(xué)習(xí)：邊試錯(cuò)邊優(yōu)化的闖關(guān)升級(jí)模式

強(qiáng)化學(xué)習(xí)的核心是在互動(dòng)中成長(zhǎng)，既沒(méi)有監(jiān)督學(xué)習(xí)的固定標(biāo)準(zhǔn)答案，也不像無(wú)監(jiān)督學(xué)習(xí)那樣沒(méi)有明確的目標(biāo)，它更像是一款闖關(guān)游戲，模型就是“玩家”，環(huán)境則是“游戲地圖”，有明確的“通關(guān)目標(biāo)”，還有即時(shí)的獎(jiǎng)懲機(jī)制。

模型會(huì)在環(huán)境中不斷嘗試行動(dòng)，做對(duì)了（靠近目標(biāo)）能拿到獎(jiǎng)勵(lì)，做錯(cuò)了（偏離目標(biāo)或遇到障礙）則得到懲罰。

通過(guò)一次次試錯(cuò)，模型可以慢慢優(yōu)化行動(dòng)策略，從“處處碰壁”到“精準(zhǔn)避坑”，最終找到最快通關(guān)的最佳路徑。

3.機(jī)器學(xué)習(xí)的學(xué)習(xí)N步曲

機(jī)器學(xué)習(xí)的過(guò)程不是一步到位的，它也有一套明確步驟的成長(zhǎng)流程，要從菜鳥(niǎo)變大神，AI也需要經(jīng)歷“找素材、選方法、勤練習(xí)、驗(yàn)成果、上崗實(shí)戰(zhàn)”的完整路徑。

圖片

機(jī)器學(xué)習(xí)的核心過(guò)程可以概括為5步：數(shù)據(jù)準(zhǔn)備→模型選擇→訓(xùn)練優(yōu)化→評(píng)估測(cè)試→部署應(yīng)用，本質(zhì)是“用數(shù)據(jù)喂模型、用反饋調(diào)整模型、用實(shí)戰(zhàn)驗(yàn)證模型”的閉環(huán)。

1）數(shù)據(jù)收集與預(yù)處理

學(xué)習(xí)的第一步就是收集學(xué)習(xí)素材（數(shù)據(jù)），如果模型要使用監(jiān)督學(xué)習(xí)方式訓(xùn)練，那么就要收集“輸入+標(biāo)簽”的配套數(shù)據(jù)，如果模型要使用無(wú)監(jiān)督學(xué)習(xí)方式進(jìn)行訓(xùn)練，那么就要收集原始無(wú)標(biāo)簽的數(shù)據(jù)。

當(dāng)然，收集到的數(shù)據(jù)還需要進(jìn)一步的加工和整理（數(shù)據(jù)清洗、數(shù)據(jù)預(yù)處理等），以便模型能夠讀懂。

2）選擇學(xué)習(xí)方式和算法

模型就像是一個(gè)學(xué)習(xí)工具，不同的模型，擅長(zhǎng)處理不同任務(wù)類型的問(wèn)題，比如有的擅長(zhǎng)處理圖片，有的擅長(zhǎng)處理文字。

模型的選擇取決于任務(wù)類型和數(shù)據(jù)特征，在訓(xùn)練時(shí)，需要根據(jù)任務(wù)的性質(zhì)和數(shù)據(jù)的特點(diǎn)來(lái)選擇模型的學(xué)習(xí)方式和算法。

文檔君整理了一個(gè)表格，三種方式到底怎么選，一目了然~

學(xué)習(xí)方式	適用場(chǎng)景	常見(jiàn)算法
監(jiān)督學(xué)習(xí)（刷題）	要預(yù)測(cè)“是/否”、“A類/B類”或具體數(shù)值，選它！	線性回歸邏輯回歸支持向量機(jī)（SVM）決策樹(shù)
無(wú)監(jiān)督學(xué)習(xí)（探索）	要找相似組、簡(jiǎn)化數(shù)據(jù)、找異常，選它！	K-均值聚類 PCA 孤立森林
強(qiáng)化學(xué)習(xí)（闖關(guān)）	要AI自主決策、邊試錯(cuò)邊成長(zhǎng)，選它！	Q-learning DQN PPO

3）訓(xùn)練優(yōu)化

模型訓(xùn)練是通過(guò)數(shù)據(jù)不斷優(yōu)化模型參數(shù)的過(guò)程。

當(dāng)把整理好的數(shù)據(jù)喂給模型，并選擇學(xué)習(xí)方式和算法后，還需要在模型的學(xué)習(xí)過(guò)程中不斷糾錯(cuò)調(diào)優(yōu)，讓模型在訓(xùn)練數(shù)據(jù)上學(xué)習(xí)規(guī)律（監(jiān)督學(xué)習(xí)學(xué)“輸入-標(biāo)簽”的映射；無(wú)監(jiān)督學(xué)習(xí)挖數(shù)據(jù)結(jié)構(gòu)；強(qiáng)化學(xué)習(xí)根據(jù)獎(jiǎng)懲情況調(diào)整策略）。