估值準(zhǔn)確率超99%!基于YOLOv11的陶瓷分類智能框架融合視覺(jué)建模與經(jīng)濟(jì)分析,實(shí)現(xiàn)文物分類及價(jià)值估測(cè) 原創(chuàng)
在保利香港拍賣 2025 春季拍賣會(huì)中,「清雍正粉彩及琺瑯彩梅竹先春祝壽圖碗」的拍賣估價(jià)飆破 880 萬(wàn)港幣,「明永樂(lè)青花竹石芭蕉圖梅瓶」更是在佳士得 2025 年香港春季拍賣會(huì)以 7812.5 萬(wàn)港幣的高價(jià)成交。此前,在 2017 年香港蘇富比的秋季拍賣會(huì)上,「北宋汝窯天青釉洗」在經(jīng)過(guò) 30 多次叫價(jià)后以 2.6 億港幣落槌,加上傭金后總計(jì)拍出了 2.94 億港幣的天價(jià),被匿名亞洲私人藏家投得,刷新了當(dāng)時(shí)中國(guó)瓷器的世界拍賣紀(jì)錄。
不難窺見(jiàn),陶瓷文物在全球范圍內(nèi)展現(xiàn)出巨大的經(jīng)濟(jì)潛力。與此同時(shí),陶瓷也滲透到了人們生活的方方面面,除了常見(jiàn)的餐具、瓷磚之外,也走進(jìn)了電子產(chǎn)品、醫(yī)療器械/植入物等領(lǐng)域。統(tǒng)計(jì)數(shù)據(jù)顯示,自 2017 年至 2023 年,中國(guó)日用陶瓷年產(chǎn)量從 491 億件增長(zhǎng)到至 679 億件,全球陶瓷市場(chǎng)規(guī)模預(yù)估還將以 4.4% 的復(fù)合年增長(zhǎng)率(CAGR)繼續(xù)擴(kuò)大。陶瓷商品交易的持續(xù)增長(zhǎng)帶來(lái)了龐大的估值需求,而傳統(tǒng)的陶瓷分類方法卻限制了非專業(yè)人士參與這項(xiàng)工作。
回顧陶瓷分類的研究實(shí)踐,傳統(tǒng)陶瓷分類方法多存在缺乏適應(yīng)性和可解釋性等局限。經(jīng)驗(yàn)識(shí)別缺乏統(tǒng)一的量化標(biāo)準(zhǔn),高度依賴「眼學(xué)」,可能因認(rèn)知差異的分歧導(dǎo)致分類模糊,同一件陶瓷在不同的專業(yè)人士手中可能出現(xiàn)大幅度的估值差異,同時(shí)對(duì)仿品的辨識(shí)度不足;而 X 射線熒光、熱釋光定年和光譜分析等精確識(shí)別高度依賴復(fù)雜儀器。
隨著深度學(xué)習(xí)和計(jì)算機(jī)視覺(jué)技術(shù)的快速發(fā)展,基于特征提取、圖像分割和圖像增強(qiáng)等方法的陶瓷分類日益普遍。目前,對(duì)陶瓷自動(dòng)化分類的研究已實(shí)現(xiàn)利用卷積神經(jīng)網(wǎng)絡(luò)(CNNs)、遷移學(xué)習(xí)以及膠囊網(wǎng)絡(luò),使用視覺(jué)屬性對(duì)陶瓷進(jìn)行了自動(dòng)化分析,通常局限于基本的紋理識(shí)別,難以將陶瓷的歷史、美學(xué)等影響估值的文化因素納入計(jì)算框架, 同時(shí)缺乏非專業(yè)愛(ài)好者可操作的分類工具。
在此背景下,馬來(lái)西亞博特拉大學(xué)研究團(tuán)隊(duì)聯(lián)合新南威爾士大學(xué)悉尼分校,基于 YOLOv11 模型共同提出了兼具高預(yù)測(cè)性能和可解釋性的智能框架,將視覺(jué)建模和經(jīng)濟(jì)推理相結(jié)合,用于陶瓷文物自動(dòng)分類及其市場(chǎng)價(jià)值估測(cè)。改進(jìn)后的 YOLOv11 模型能夠?qū)⒋善鞯墓に噷傩暂斎腚S機(jī)森林分類器,基于佳士得、蘇富比、保利拍賣和中國(guó)嘉德等機(jī)構(gòu)多年拍賣數(shù)據(jù)對(duì)陶瓷文物進(jìn)行估值。
該研究成果以「Integrating deep learning and machine learning for ceramic artifact classification and market value prediction」為題,發(fā)表于 Nature Partner Journals 。
研究亮點(diǎn):
* 建立了穩(wěn)健的數(shù)據(jù)驅(qū)動(dòng)框架,能夠整合藝術(shù)特征和市場(chǎng)數(shù)據(jù)準(zhǔn)確評(píng)估陶瓷文物,為陶瓷分類及估值提供更為系統(tǒng)客觀的方法;
* 增強(qiáng)了 YOLO 模型在檢測(cè)和分類陶瓷類型方面的性能,優(yōu)化 YOLO 模型在陶瓷分類后續(xù)估值任務(wù)中的輸出;
* 結(jié)合基于 YOLO 模型提取的特征和結(jié)構(gòu)化拍賣數(shù)據(jù),使用隨機(jī)森林分類器預(yù)測(cè)價(jià)格,提高預(yù)測(cè)結(jié)果的準(zhǔn)確性與可解釋性。

論文地址:
??https://www.nature.com/articles/s40494-025-01886-6??
關(guān)注公眾號(hào),后臺(tái)回復(fù)「陶瓷」獲取完整 PDF
更多 AI 前沿論文: ??https://go.hyper.ai/owxf6??
三階段集成:數(shù)據(jù)標(biāo)注、陶瓷分類和價(jià)格預(yù)測(cè)
該研究建構(gòu)的分類框架包括 3 個(gè)連續(xù)階段:數(shù)據(jù)標(biāo)注、基于 YOLOv11 模型的陶瓷分類和基于隨機(jī)森林回歸模型的價(jià)格預(yù)測(cè)。

分類框架流程圖
數(shù)據(jù)集標(biāo)注:AI 預(yù)處理與專家修正的混合標(biāo)注方案
該研究基于形狀、紋樣和生產(chǎn)工藝的三層陶瓷分類框架建立了高質(zhì)量陶瓷圖像數(shù)據(jù)集。該數(shù)據(jù)集包含 8,213 張高分辨率圖像,圖像涵蓋了 20 種不同的特定窯系和裝飾技法風(fēng)格,并按照 7:2:1 的比例劃分為訓(xùn)練數(shù)據(jù)、驗(yàn)證數(shù)據(jù)和測(cè)試數(shù)據(jù)。
圖像數(shù)據(jù)主要來(lái)自 3 個(gè)渠道:一是佳士得、蘇富比、邦瀚斯、中國(guó)嘉德、保利拍賣、北京榮寶齋等拍賣行(42.6%,3500 幅);二是博物館及文物數(shù)據(jù)庫(kù)(24.3%,2000 幅),包括故宮博物院、大英博物館、大都會(huì)藝術(shù)博物館、中國(guó)國(guó)家博物館、國(guó)際博物館協(xié)會(huì)數(shù)據(jù)庫(kù)等;三是陶瓷藝術(shù)品商店及實(shí)地?cái)z影作品(33.1%,2713 幅),主要來(lái)源于淘寶、閑魚(yú)、亞馬遜、 Pixabay 、維基共享資源等平臺(tái)以及私人收藏家。
研究采用了混合數(shù)據(jù)采集方法,例如使用 Scrapy 框架進(jìn)行自動(dòng)化網(wǎng)頁(yè)抓取,從公共數(shù)據(jù)庫(kù)中提取結(jié)構(gòu)化陶瓷圖像數(shù)據(jù)。
數(shù)據(jù)集標(biāo)注階段主要采用 AI 自動(dòng)采集與專家修正的標(biāo)記策略,對(duì)高質(zhì)量的陶瓷圖像數(shù)據(jù)集進(jìn)行標(biāo)注:
* AI 預(yù)標(biāo)注:利用 YOLO 預(yù)訓(xùn)練模型對(duì)初始材料進(jìn)行檢測(cè),自動(dòng)生成陶瓷輪廓的邊界框;
* 人工標(biāo)注與驗(yàn)證:由陶瓷鑒定專家和數(shù)據(jù)研究人員使用 LabelImg 工具優(yōu)化標(biāo)注結(jié)果,根據(jù)工藝風(fēng)格、器物形狀、裝飾圖案進(jìn)行三級(jí)分類。

工藝風(fēng)格分類

器物形狀分類

裝飾圖案分類
為了進(jìn)一步提高模型魯棒性并評(píng)估泛化能力,研究團(tuán)隊(duì)采用了 5 倍交叉驗(yàn)證,并且使用 K-means 聚類優(yōu)化錨框尺寸以適應(yīng)不同的陶瓷形狀,從而提高檢測(cè)精度。應(yīng)用循環(huán)學(xué)習(xí)率調(diào)度器(Cyclic Learning Rate Scheduler)來(lái)穩(wěn)定梯度更新,同時(shí)結(jié)合早停機(jī)制(Early Stopping)與模型檢查點(diǎn)(checkpointin)以防止過(guò)度擬合。為了增強(qiáng)空間泛化能力,研究還使用了 Mosaic 、 GridMask 和 MixUp 圖像增強(qiáng)技術(shù)進(jìn)行驗(yàn)證。
YOLOv11 模型:引入注意力模塊形成估價(jià)邏輯機(jī)制
在 AI 預(yù)處理的數(shù)據(jù)集基礎(chǔ)上,改進(jìn)后的 YOLOv11 模型將根據(jù)陶瓷的形狀、紋樣和生產(chǎn)工藝對(duì)圖像進(jìn)行分類。改進(jìn)后的 YOLOv11 模型架構(gòu)集成了 ResNet 主干網(wǎng)絡(luò)、多個(gè)特征增強(qiáng)模塊以及針對(duì)圖案、形狀和工藝風(fēng)格等陶瓷屬性優(yōu)化后的檢測(cè)頭(Detection Head)。

改進(jìn)后的 YOLOv11 模型架構(gòu)
改進(jìn)后的 YOLOv11 模型以 ResNet50 為主干網(wǎng)絡(luò)。為提升模型對(duì)陶瓷視覺(jué)特征的表達(dá)和計(jì)算效率,本研究在結(jié)構(gòu)上引入了 3 個(gè)增強(qiáng)模塊:
* C3k2-EIEM 模塊:該模塊包含邊緣信息學(xué)習(xí)、空間特征保留和特征融合策略三個(gè)關(guān)鍵組件,通過(guò)明確捕捉邊緣信息并保留空間細(xì)節(jié),保留高分辨率空間細(xì)節(jié),增強(qiáng)對(duì)雕刻、銘文等細(xì)粒度裝飾細(xì)節(jié)的檢測(cè);
* 快速空間金字塔池化(SPPF):通過(guò)執(zhí)行多維池化提取陶瓷不同維度下的視覺(jué)特征;
* 跨階段局部注意力機(jī)制(C2PSA):通過(guò)自適應(yīng)調(diào)節(jié)權(quán)重減少圖片背景干擾,從而聚焦關(guān)鍵裝飾區(qū)域,增強(qiáng)模型對(duì)釉下彩繪、鏤空雕花等復(fù)雜裝飾的敏感度。
注意力增強(qiáng)模塊的集成提高了模型對(duì)陶瓷高價(jià)值特征的識(shí)別能力。為鏈接分類結(jié)果輸出和傳統(tǒng)估值邏輯,本研究引入了梯度加權(quán)類激活映射(Grad-CAM)生成注意力模塊的可視化圖像,驗(yàn)證注意力模塊的有效性。
隨機(jī)森林回歸模型:從視覺(jué)特征到貨幣價(jià)值評(píng)估
在價(jià)格預(yù)測(cè)階段,研究設(shè)置了一個(gè)基于隨機(jī)森林(RF)的回歸模型,并采用基于分類的價(jià)格預(yù)測(cè)方法,根據(jù)提取的視覺(jué)特征系統(tǒng)預(yù)測(cè)陶瓷制品的收藏價(jià)值。隨機(jī)森林回歸模型對(duì)所采集視覺(jué)特征的分類流程分為四點(diǎn):
* 類別特征:對(duì)裝飾紋樣和工藝風(fēng)格等分類特征使用 One-Hot 編碼進(jìn)行處理,將視覺(jué)特征轉(zhuǎn)化為機(jī)器可讀的數(shù)據(jù)化表達(dá)。
* 拍賣價(jià)格歸一化與異常值處理:將六大拍賣行 2000 年至 2024 年的陶瓷文物交易價(jià)格均根據(jù)歷史匯率以及世界銀行、經(jīng)濟(jì)合作與發(fā)展組織(OECD)等國(guó)際金融數(shù)據(jù)庫(kù)公布的消費(fèi)者物價(jià)指數(shù)(CPI)數(shù)據(jù),折算并歸一化為 2024 年的美元(USD),并采用四分位距(IQR)方法剔除拍賣價(jià)格數(shù)據(jù)中的異常值。
* 定量特征:納入形狀、裝飾紋樣和工藝復(fù)雜性的自變量因素,以及價(jià)格區(qū)間的因變量因素,所有定量特征均采用最小-最大縮放法進(jìn)行歸一化。
* 數(shù)據(jù)編碼:實(shí)施結(jié)構(gòu)化數(shù)據(jù)編碼策略,使用獨(dú)熱編碼(OHE)將非數(shù)值的離散值轉(zhuǎn)化為二進(jìn)制,使其能夠被回歸模型捕捉而無(wú)需引入人為的數(shù)值關(guān)系。
RF 分類模型在訓(xùn)練回歸模型時(shí)則將流程分為數(shù)據(jù)預(yù)處理、特征提取、集成訓(xùn)練和預(yù)測(cè)四個(gè)階段,在訓(xùn)練過(guò)程中構(gòu)建多個(gè)決策樹(shù),每個(gè)決策樹(shù)都基于數(shù)據(jù)的引導(dǎo)樣本進(jìn)行訓(xùn)練,以降低數(shù)據(jù)方差。

隨機(jī)森林模型架構(gòu)
研究結(jié)果:YOLOv11 與 RF 雙驅(qū),模型估值準(zhǔn)確率提升
研究將改進(jìn)后的 YOLOv11 模型與 YOLOv11 模型進(jìn)行了性能評(píng)估,并對(duì)增強(qiáng)的功能模塊進(jìn)行了 5 倍交叉驗(yàn)證,同時(shí)評(píng)估了隨機(jī)森林回歸模型的估值邏輯及其準(zhǔn)確率等性能指標(biāo)。
首先是改進(jìn)后的 YOLOv11 模型與 YOLOv11 模型在陶瓷分類方面的性能評(píng)估結(jié)果,關(guān)鍵檢測(cè)指標(biāo)包括平均準(zhǔn)確率(mAP)、召回率(Recall)、準(zhǔn)確率(Precision)和最佳 F1 得分(Best-F1)。實(shí)驗(yàn)結(jié)果表明,改進(jìn)后的 YOLOv11 模型整體檢測(cè)精度有所提高,減少了對(duì)形狀或釉面細(xì)節(jié)的假陰性檢測(cè),最佳 F1 值提升 2% 。雖然準(zhǔn)確率略有下降,但通過(guò)平衡假陽(yáng)性和假陰性結(jié)果提升了模型的泛化能力。

改進(jìn)后的 YOLOv11 模型與 YOLOv11 模型性能比較
為確保 C3k2-EIEM 增強(qiáng)型 YOLOv11 模型的穩(wěn)健性和泛化能力,研究進(jìn)行了 5 倍交叉驗(yàn)證,結(jié)果表明,增強(qiáng)的功能模塊有助于實(shí)現(xiàn)更一致的分類性能。

交叉驗(yàn)證結(jié)果
隨機(jī)森林回歸模型性能評(píng)估標(biāo)準(zhǔn)包括準(zhǔn)確率、精確率、召回率、 F1 分?jǐn)?shù)和 AUC 。在訓(xùn)練集上,模型的準(zhǔn)確率達(dá)到 99.65%,準(zhǔn)確率、召回率和 F1 得分均為 99.65% 。在獨(dú)立測(cè)試集上,模型的準(zhǔn)確率為 98.91%,準(zhǔn)確率、召回率和 F1 得分也均為 98.91%,在預(yù)測(cè)陶瓷市場(chǎng)價(jià)值類別方面表現(xiàn)穩(wěn)健。

價(jià)格分類的 ROC 曲線分析
此外,隨機(jī)森林回歸模型強(qiáng)調(diào)工藝復(fù)雜性在市場(chǎng)價(jià)值上的影響,其估值邏輯與歷史拍賣趨勢(shì)一致。

隨機(jī)森林模型中價(jià)格分類的特征重要性
AI 賦能,在數(shù)字時(shí)代延續(xù)窯火呼吸
AI 技術(shù)對(duì)陶瓷和文物行業(yè)的重構(gòu)從未停止。此前,新加坡華人李鑒宸打造的鑒定系統(tǒng),已推動(dòng)以往耗時(shí)耗力的陶瓷分類進(jìn)入了光速鑒定時(shí)代。該系統(tǒng)涵蓋了約 200 萬(wàn)件文物數(shù)據(jù),其采用的多光譜掃描技術(shù)和傳統(tǒng)鑒定師的時(shí)以年計(jì)的「目測(cè)」相比,能夠僅根據(jù)陶瓷釉面的氣泡形態(tài),對(duì)照時(shí)代工藝后即可完成斷代分析。
值得一提的是,該系統(tǒng)還能通過(guò)多模態(tài)光譜成像捕捉隱藏的修復(fù)痕跡。 2025 年 5 月,李鑒宸團(tuán)隊(duì)就意外掃描發(fā)現(xiàn)臺(tái)北故宮《早春圖》覆蓋層下的北宋題跋痕跡,使該文物的市場(chǎng)估值翻倍增長(zhǎng)。
2024 年,北京大學(xué)考古文博學(xué)院科技考古實(shí)驗(yàn)室與北京壹據(jù)技術(shù)有限公司還合作開(kāi)發(fā)了古陶瓷溯源在線分析系統(tǒng)。據(jù)悉,該項(xiàng)目覆蓋了包括 100 多處知名窯址在哪的的古陶瓷釉面成分?jǐn)?shù)據(jù)庫(kù),收集了近百萬(wàn)條陶瓷主微量元素?cái)?shù)據(jù),壹據(jù)技術(shù)開(kāi)發(fā)的手持式 XRF 古陶瓷智能檢測(cè)系統(tǒng)具有無(wú)損、便攜、快速、高準(zhǔn)確率等優(yōu)點(diǎn),已在多個(gè)重要考古遺址使用。
目前,AI 正不斷革新陶瓷「經(jīng)驗(yàn)議價(jià)」的行業(yè)生態(tài),推動(dòng)陶瓷向算法驅(qū)動(dòng)模式行進(jìn)。 AI 與陶瓷的碰撞,是一場(chǎng)技術(shù)對(duì)文明的承接與重塑,數(shù)字時(shí)代的全新脈動(dòng),將讓千年瓷韻走向更廣闊的時(shí)空維度。
參考鏈接:
1 、 ??https://www.prnewswire.com/apac/zh/news-releases/2025-302429982.html???
2 、 ??https://www.sohu.com/a/913181430_121393815???
3 、 ??https://www.sohu.com/a/199794691_687796???
4 、 ??https://pff.szzit.cn/2d41???
5 、 ??https://pff.szzit.cn/2d4A???
6 、 ??https://ourl.cn/G2FTpz??

















