
整理 | 涂承燁
審校 | 重樓
1.背景
隨著農(nóng)業(yè)現(xiàn)代化進(jìn)程的推進(jìn),人工智能技術(shù)在農(nóng)作物病蟲(chóng)害識(shí)別領(lǐng)域展現(xiàn)出廣闊的應(yīng)用前景。我國(guó)每年因病蟲(chóng)害導(dǎo)致的果品蔬菜損失高達(dá)25%以上,化學(xué)農(nóng)藥濫用現(xiàn)象嚴(yán)重,并對(duì)生態(tài)環(huán)境造成破壞。本文基于深度學(xué)習(xí)技術(shù),提出了一種高效的植物蟲(chóng)害識(shí)別方法,旨在實(shí)現(xiàn)快速、準(zhǔn)確、智能的病蟲(chóng)害診斷,為農(nóng)民提供科學(xué)指導(dǎo),推動(dòng)綠色農(nóng)業(yè)發(fā)展。
農(nóng)作物病蟲(chóng)害是影響農(nóng)業(yè)生產(chǎn)的重要因素之一。傳統(tǒng)的病蟲(chóng)害識(shí)別方法依賴人工檢測(cè)和經(jīng)驗(yàn)判斷,存在成本高、效率低、對(duì)專業(yè)知識(shí)要求高等問(wèn)題。近年來(lái),深度學(xué)習(xí)技術(shù)在圖像識(shí)別領(lǐng)域取得顯著進(jìn)展,為農(nóng)業(yè)病蟲(chóng)害智能識(shí)別提供了新的解決方案。本研究聚焦柑橘常見(jiàn)病蟲(chóng)害,構(gòu)建了一個(gè)基于卷積神經(jīng)網(wǎng)絡(luò)的識(shí)別模型,并結(jié)合實(shí)際應(yīng)用場(chǎng)景進(jìn)行了系統(tǒng)驗(yàn)證。
2.現(xiàn)狀
農(nóng)作物病蟲(chóng)害的識(shí)別,主要有三種方法:
- 人工檢測(cè):成本高,不易推廣。
- 機(jī)器學(xué)習(xí)算法:傳統(tǒng)的農(nóng)作物病害識(shí)別方法主要基于機(jī)器學(xué)習(xí)算法,需要人工設(shè)計(jì)特征,對(duì)專業(yè)知識(shí)和經(jīng)驗(yàn)要求較高,且識(shí)別準(zhǔn)確率有限。
- 深度學(xué)習(xí):能夠自動(dòng)學(xué)習(xí)圖像中的特征表征,具有更強(qiáng)的表達(dá)能力和泛化性能。然而,深度學(xué)習(xí)模型需要大量標(biāo)注數(shù)據(jù)作為支撐,在農(nóng)業(yè)領(lǐng)域數(shù)據(jù)采集面臨如下困難:
- 采集成本高、采集難度大、采集周期長(zhǎng)。
- 標(biāo)注難度大、類別不平衡等挑戰(zhàn)。
- 不同病害間特征有相似性。
具體說(shuō)來(lái),果樹(shù)樹(shù)干高大、樹(shù)葉茂密,會(huì)相互遮掩,難以用高空假設(shè)的攝像機(jī)獲取到病害圖像。前期采集數(shù)據(jù)都是人工手機(jī)拍攝的,所以需要耗費(fèi)大量的人力。
柑橘潛葉蛾是潰瘍病誘發(fā)主要因素之一,潛葉蛾喜高溫、喜濕,在低溫低濕情況下,活躍度不高、病害發(fā)生概率低,主要危害柑橘新梢嫩葉。3-11月左右均有病害發(fā)生,3至5月的時(shí)候病害較少,主要發(fā)病時(shí)間集中在8至9月和秋梢形成后。
在6、7月份閩清高溫雨少時(shí)期,柑桔銹壁虱數(shù)量會(huì)暴增、數(shù)量暴增后大約在8月份將出現(xiàn)柑橘銹壁虱病害高峰。所以采集圖像時(shí)間線往往需要更久;且由于病害的防治措施、力度和效果不一,有些防治得較好的,采集病害圖像更是“可遇不可求”,會(huì)出現(xiàn)病害圖像數(shù)據(jù)分布不均勻的問(wèn)題。
3.數(shù)據(jù)分析
本研究共收集了3305張柑橘圖像,包括1040張潰瘍病圖像、299張瘡痂病圖像、320張潛葉蛾圖像、210張銹壁虱圖像以及202張正常葉果圖像。

柑橘潰瘍病病葉和病果

柑橘瘡痂病病葉和病果

柑橘潛葉蛾病葉

柑橘銹壁虱病果

柑橘正常葉果圖例
數(shù)據(jù)特點(diǎn)表現(xiàn)為樣本量有限且分布不均衡,這對(duì)模型訓(xùn)練提出了挑戰(zhàn)。
針對(duì)數(shù)據(jù)不足的問(wèn)題,研究采用了數(shù)據(jù)增強(qiáng)技術(shù),通過(guò)對(duì)原始圖像進(jìn)行旋轉(zhuǎn)、縮放、裁剪等操作擴(kuò)充數(shù)據(jù)集。同時(shí),針對(duì)光照不均等問(wèn)題,進(jìn)行了相應(yīng)的預(yù)處理工作,以提高模型魯棒性。
4.深度學(xué)習(xí)應(yīng)用
相關(guān)概念了解-深度學(xué)習(xí)
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)子集,其核心是使用被稱為“深度神經(jīng)網(wǎng)絡(luò)”的復(fù)雜結(jié)構(gòu)來(lái)學(xué)習(xí)數(shù)據(jù)中的層次化特征。
- 工作原理:通過(guò)多層處理層(輸入層、隱藏層、輸出層)進(jìn)行非線性變換,逐層提取從低級(jí)到高級(jí)的特征。例如,在圖像識(shí)別中,底層可能識(shí)別邊緣和角點(diǎn),中間層識(shí)別紋理和部件,最高層則識(shí)別完整的物體(如貓臉、車輪)。
- 關(guān)鍵要求:需要大量的標(biāo)注數(shù)據(jù)和強(qiáng)大的計(jì)算資源(如GPU)來(lái)訓(xùn)練數(shù)以百萬(wàn)計(jì)的參數(shù)。
- 例子:下文中的13層的卷積神經(jīng)網(wǎng)絡(luò)(CNN)就是一個(gè)深度學(xué)習(xí)模型。它被設(shè)計(jì)用來(lái)直接從柑橘圖像中學(xué)習(xí)如何分類病蟲(chóng)害。
相關(guān)概念了解-遷移學(xué)習(xí)
遷移學(xué)習(xí)是一種機(jī)器學(xué)習(xí)技術(shù),其核心思想是“舉一反三”。
- 工作原理:找到一個(gè)在大規(guī)模數(shù)據(jù)集(如ImageNet,包含1400多萬(wàn)張各種物體的圖片)上預(yù)訓(xùn)練好的成熟模型(如VGG16、ResNet)。這個(gè)模型已經(jīng)學(xué)會(huì)了提取圖像的通用特征(如邊緣、紋理、形狀)。我們保留這個(gè)模型的特征提取部分,只替換和重新訓(xùn)練最后的分類層,使其適應(yīng)我們特定的、數(shù)據(jù)量少的新任務(wù)(如柑橘病蟲(chóng)害識(shí)別)。
- 關(guān)鍵優(yōu)勢(shì):避免了從零開(kāi)始訓(xùn)練,節(jié)省了大量時(shí)間、計(jì)算資源和數(shù)據(jù)需求。它特別適合像農(nóng)業(yè)病蟲(chóng)害識(shí)別這種標(biāo)注數(shù)據(jù)難以獲取的領(lǐng)域。
- 例子:下文中,研究人員發(fā)現(xiàn)自己的柑橘數(shù)據(jù)集“數(shù)據(jù)量少,數(shù)據(jù)分布不均衡”,導(dǎo)致模型效果不佳。于是他們引入了遷移學(xué)習(xí),使用在ImageNet上預(yù)訓(xùn)練好的VGG16模型作為起點(diǎn),大幅提升了所有病蟲(chóng)害類別的識(shí)別準(zhǔn)確率。
實(shí)際應(yīng)用
本研究設(shè)計(jì)了一個(gè)13層的深度卷積神經(jīng)網(wǎng)絡(luò),其中包含6層卷積層和3層全連接層。

網(wǎng)絡(luò)采用了一系列先進(jìn)設(shè)計(jì):
- 一個(gè)段內(nèi)有多個(gè)3 ×3的卷積層堆疊
- 使用ReLU作為激活函數(shù):ReLU為非飽和函數(shù),在較深的網(wǎng)絡(luò)超過(guò)了Sigmoid,成功解決了Sigmoid在網(wǎng)絡(luò)較深時(shí)的梯度彌散問(wèn)題。
- 重疊的最大池化(Max-pooling):池化的步長(zhǎng)小于核尺寸;最大池化,避免平均池化的模糊化效果。
- Dropout避免模型過(guò)擬合(減少過(guò)擬合的主要方法)
- 數(shù)據(jù)增強(qiáng)(DataAugmentation)(減少過(guò)擬合的主要方法)
- 使用GPU加快計(jì)算速度
5.實(shí)驗(yàn)結(jié)果與分析
基準(zhǔn)模型性能
在不使用遷移學(xué)習(xí)的情況下,模型在測(cè)試集上的整體表現(xiàn)如下:潰瘍病識(shí)別效果最佳(F值=0.91),其次是銹壁虱(F值=0.85)和潛葉蛾(F值=0.79),瘡痂病和正常葉果的識(shí)別效果相對(duì)較差(F值分別為0.71和0.68)。結(jié)果表明,模型性能與樣本數(shù)量呈正相關(guān)關(guān)系。

實(shí)驗(yàn)結(jié)果1

實(shí)驗(yàn)結(jié)果2
遷移學(xué)習(xí)應(yīng)用
為解決數(shù)據(jù)不平衡問(wèn)題,本研究引入了遷移學(xué)習(xí)技術(shù),使用在ImageNet數(shù)據(jù)集上預(yù)訓(xùn)練的VGG16模型作為特征提取器,僅微調(diào)最后幾層網(wǎng)絡(luò)以適應(yīng)病蟲(chóng)害識(shí)別任務(wù)。

遷移學(xué)習(xí)顯著提升了模型性能:
潰瘍病:F值從0.91提升至0.99
潛葉蛾:F值從0.79提升至0.93
銹壁虱:F值從0.85提升至0.95
瘡痂病:F值從0.71提升至0.96
正常葉果:F值從0.68提升至0.94
平均F值從0.788提升至0.954,證明遷移學(xué)習(xí)有效解決了小樣本和不平衡數(shù)據(jù)問(wèn)題。

引進(jìn)遷移學(xué)習(xí)后的實(shí)驗(yàn)結(jié)果
6.結(jié)論與展望
本研究提出了一種基于深度學(xué)習(xí)的柑橘蟲(chóng)害識(shí)別方法,通過(guò)設(shè)計(jì)合適的網(wǎng)絡(luò)架構(gòu)和引入遷移學(xué)習(xí)技術(shù),有效解決了農(nóng)業(yè)圖像數(shù)據(jù)量少、不平衡等問(wèn)題,實(shí)現(xiàn)了高精度的病蟲(chóng)害識(shí)別。
未來(lái)工作可從以下幾方面展開(kāi):
- 收集更多病蟲(chóng)害圖像數(shù)據(jù),進(jìn)一步優(yōu)化模型性能
- 探索輕量級(jí)網(wǎng)絡(luò)架構(gòu),便于移動(dòng)端部署
- 擴(kuò)展識(shí)別種類,覆蓋更多農(nóng)作物病蟲(chóng)害類型
- 結(jié)合氣象、土壤等多源數(shù)據(jù),構(gòu)建更加全面的病蟲(chóng)害預(yù)警系統(tǒng)
本研究為農(nóng)業(yè)生產(chǎn)中的病蟲(chóng)害智能識(shí)別提供了有效解決方案,對(duì)減少農(nóng)藥濫用、保護(hù)生態(tài)環(huán)境、提高農(nóng)業(yè)生產(chǎn)效率具有重要意義。






























