国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

分類模型性能度量:錯誤率與精度、查準率與查全率、P-R曲線與平衡點及F1度量的聯(lián)系與區(qū)別

發(fā)布于 2025-6-10 06:37
瀏覽
0收藏

對模型的泛化性能進行評估,不僅需要有效可行的試驗估計方法,還需要具有衡量模型泛化能力的評價標準,即性能度量。且在不同的任務(wù)中對比模型的性能時,使用不同的性能度量往往會導(dǎo)致不同的評判結(jié)果。在分類任務(wù)中,最常用的性能度量有錯誤率、精度、查準率、查全率、F1分數(shù)及AUC-ROC曲線。

01 | 錯誤率與精度

(1) 錯誤率(error rate)是分類錯誤的樣本數(shù)占樣本總數(shù)(m)的比例。計算公式可表示為:

分類模型性能度量:錯誤率與精度、查準率與查全率、P-R曲線與平衡點及F1度量的聯(lián)系與區(qū)別-AI.x社區(qū)

(2) 精度(accuracy)是分類正確的樣本數(shù)占樣本總數(shù)的比例。計算公式可表示為:

分類模型性能度量:錯誤率與精度、查準率與查全率、P-R曲線與平衡點及F1度量的聯(lián)系與區(qū)別-AI.x社區(qū)

02 | 查準率與查全率

(1) 二分類混淆矩陣:在二分類問題中,可將樣本根據(jù)其真實類別與模型預(yù)測類別的組合劃分為真正例、假正例、真反例與假反例四種情形。

分類模型性能度量:錯誤率與精度、查準率與查全率、P-R曲線與平衡點及F1度量的聯(lián)系與區(qū)別-AI.x社區(qū)

(2) 查準率(或準確率)定義為:在預(yù)測結(jié)果為正例的所有樣例中,預(yù)測正確(真實情況也為正例)的概率。

分類模型性能度量:錯誤率與精度、查準率與查全率、P-R曲線與平衡點及F1度量的聯(lián)系與區(qū)別-AI.x社區(qū)

(3) 查全率(或召回率)定義為:在真實情況為正例的所有樣例中,預(yù)測正確(預(yù)測結(jié)果也為正例)的概率。

(4) 查準率與查全率是一對矛盾的變量。一般來說,查準率高時,查全率往往偏低;反之亦然。

(a) 影響兩者大小變化的關(guān)鍵在于FP和FN。

分類模型性能度量:錯誤率與精度、查準率與查全率、P-R曲線與平衡點及F1度量的聯(lián)系與區(qū)別-AI.x社區(qū)

(b) 假設(shè)分類閾值降低,則模型預(yù)測結(jié)果為正例的樣例數(shù)量將會增加(同時,模型預(yù)測結(jié)果為反例的樣例數(shù)量將會減少),此操作保證盡量不遺漏正例,即TP將會增加。

(b) 同時,此操作將會使真實情況為正例,但預(yù)測結(jié)果為反例的情況減少,即FN減少。

(c) 同時,此操作將會使真實情況為反例,但預(yù)測結(jié)果為正例的情況增加,即FP增加。

(d) 綜上所述,在分類閾值降低的情況下將會出現(xiàn),TP變大、FN變小和FP變大的情況。根據(jù)查全率和查準率的比值公式可知,二者的比值將會減小。這意味著,查準率P減小了,而查全率R增大了,即二者并非同時變大或變小,而是一者增大則另一者減小。此即證明查準率與查全率的矛盾所在。

(5) 高查準率要求更嚴格的篩選,希望模型在預(yù)測正例時盡量準確,需設(shè)置較高的分類閾值,如在病情診斷中,醫(yī)生傾向于更嚴格的判斷以避免誤診(高查準率),但也可能遺漏部分真實患者(低查全率)。

(6) 高查全率需要放寬篩選,希望盡可能捕獲所有正例,需降低分類閾值,以將更多樣例標記為正例,例如,在逃犯搜捕中,警方放寬篩選條件以“寧可錯查一千”的策略(高查全率),但會誤傷大量無辜者(低查準率)。

03 | P-R曲線與平衡點

(1) P-R曲線可視化了不同分類閾值下查準率與查全率的動態(tài)關(guān)系,為解決二者的矛盾,為模型調(diào)優(yōu)、閾值選擇及場景適配提供了核心工具。

(2) 繪制P-R曲線

(a) 根據(jù)模型預(yù)測結(jié)果對樣例進行排序,排在前面的是模型認為“最可能”是正例的樣本,排在后面的是模型認為“最不可能”是正例的樣本。

(b) 按此順序逐個把樣本作為正例進行預(yù)測(即從大到小將每個樣本的預(yù)測結(jié)果作為分類閾值),則每次可以計算出當前的查全率和查準率。

(c) 最后以查準率為縱軸、查全率為橫軸作圖,即可得到查準率-查全率曲線,簡稱P-R曲線。

分類模型性能度量:錯誤率與精度、查準率與查全率、P-R曲線與平衡點及F1度量的聯(lián)系與區(qū)別-AI.x社區(qū)

(3) P-R曲線能直觀地顯示出模型在樣本總體上的查全率、查準率。

(a) 若一個模型的P-R曲線被另一個模型的P-R曲線完全包裹,則可斷言后者的性能優(yōu)于前者。如上圖中的模型A的性能優(yōu)于模型C。

(b) 若兩個模型的P-R曲線發(fā)生交叉,如上圖中的A和B,則無法直接斷定兩者孰優(yōu)孰劣。一個比較合理的判斷依據(jù)則是比較P-R曲線下面積的大小,能在一定程度上表征模型在查準率和查全率上取得相對“雙高”的比例,但這個值不容易估算。

(4) 為能綜合考慮查準率、查全率的性能度量,設(shè)計了“平衡點”(Break-Event Point,BEP)這一度量。

(a) BEP是“查準率=查全率”時的取值。如上圖中模型C的BEP是0.64。

(b) 故基于BEP的比較,可以認為模型A的性能優(yōu)于模型B。

(c) 但BEP過于簡化,在實際應(yīng)用中具有局限性。

04 | F1度量

(1)為進一步解決查準率與查全率之間的矛盾,相對于簡潔的BEP度量,F(xiàn)1度量更為常用。F1是基于查準率和查全率的調(diào)和平均定義的。

(2) 調(diào)和平均數(shù)

分類模型性能度量:錯誤率與精度、查準率與查全率、P-R曲線與平衡點及F1度量的聯(lián)系與區(qū)別-AI.x社區(qū)

本文轉(zhuǎn)載自??南夏的算法驛站??,作者:趙南夏

已于2025-6-10 09:36:41修改
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
亚洲天堂精品视频| 欧美最顶级丰满的aⅴ艳星| 免费高清成人| 日本欧美一区二区在线观看| 国产精品嫩草影院一区二区| 亚洲最大的免费视频网站| 91精品在线观看入口| 三上悠亚在线观看| 亚洲欧美自拍偷拍色图| 男人的天堂99| 91在线精品秘密一区二区| 老汉色影院首页| 麻豆91精品视频| 日本免费一区二区三区| 亚洲经典在线看| 高清av免费一区中文字幕| 国产亚洲一区| 国产精品99久久久久久www| 久草在线综合| 午夜精品在线观看| 久久国产精品免费精品3p| 久久久久久有精品国产| caoporn成人| 91精品国产91久久久久久吃药| 2020最新国产精品| 国内精品视频久久| 大香伊人久久精品一区二区| 久久久亚洲天堂| 台湾亚洲精品一区二区tv| 97精品国产91久久久久久| 精品综合久久88少妇激情| 欧美怡红院视频一区二区三区| 哺乳一区二区三区中文视频| 九九热精品在线| 天美av一区二区三区久久| 日韩av男人的天堂| 久久中文视频| 久久波多野结衣| 久久99久国产精品黄毛片色诱| 日本大片免费看| 日本一区二区视频在线观看| 日本中文字幕高清视频| 日韩欧美在线中文字幕| 欧美激情视频在线播放| 亚洲国产精品一区二区三区| 久久精品女人天堂av免费观看| 日韩视频中文字幕| 综合伊思人在钱三区| 亚洲一区二区中文| 丝袜美腿一区二区三区| 国产精品av免费观看| 亚洲国产精品国自产拍av| 尤物视频免费在线观看| 91精品国产福利在线观看| videos性欧美另类高清| 久久全球大尺度高清视频| 欧美69视频| 国产精品久久成人免费观看| 91视视频在线观看入口直接观看www | 欧美黄色影院| 成人一区二区三区四区| 美美哒免费高清在线观看视频一区二区 | 亚洲一区二区中文在线| 国产小视频在线播放| 亚洲福利精品在线| 国产成人精品亚洲线观看| 成人综合电影| 成人美女视频在线观看| 在线视频您懂的| 亚洲午夜国产成人av电影男同| 欧美精品乱码| 青青草免费在线视频观看| 亚洲成人精品影院| 成人福利视频| 91在线视频免费| 久久综合五月天婷婷伊人| avav免费在线观看| 色综合久综合久久综合久鬼88| 亚洲乱码久久| av五月婷婷| 国产亚洲欧美另类中文| 在线免费高清一区二区三区| 午夜精品在线免费观看| 精品国产91九色蝌蚪| 日韩欧美高清| 日韩免费毛片视频| 精品国产亚洲在线| 亚洲澳门在线| 手机看片一级片| 亚洲男人天堂2019| 国产精品va| 男女羞羞视频教学| 亚洲人午夜精品免费| 国产精品mm| 1区不卡电影| 色小说视频一区| 日本不卡免费在线视频| 外国精品视频在线观看| 色在人av网站天堂精品| 激情综合色综合久久| 二人午夜免费观看在线视频| 欧美在线亚洲在线| 久久综合狠狠综合久久综合88 | 日本电影一区二区三区| 一区二区三区日韩在线观看| 国产精品第一| 欧美日韩亚洲综合一区二区三区激情在线 | 久久亚洲一区二区三区四区五区高 | 欧美大片国产精品| 国产精品99视频| 91视频免费版污| 亚洲精品www久久久| 精品96久久久久久中文字幕无| 国产精品三级a三级三级午夜| 国产亚洲精品高潮| 免费久久99精品国产| 成人免费在线电影| 成人av番号网| 日韩毛片高清在线播放| 91精品丝袜国产高跟在线| 国产免费黄色小视频| 亚洲精品日韩丝袜精品| 蜜臀av性久久久久蜜臀aⅴ流畅| 自拍视频在线网| 国产精品对白一区二区三区| 欧美日韩中文字幕在线视频| 日韩精品2区| 色就是色亚洲色图| 91亚洲国产成人久久精品网站| 亚洲午夜日本在线观看| 欧美一级一片| 黄色三级在线观看| 国产精品稀缺呦系列在线| 亚洲另类中文字| 国产亚洲精品美女久久久久久久久久| 成人小视频在线看| 欧美日本亚洲视频| 久久久久久免费网| 老牛影视av一区二区在线观看| 成人拍拍拍免费视频网站| 国产成人高潮免费观看精品| 亚洲成人av一区二区| 午夜久久99| 国产成人高清精品| 一道本在线观看视频| 中文日韩在线视频| 91麻豆国产自产在线观看| 久久悠悠精品综合网| 一个人看的www一区| 国产伦精品一区二区三区高清版| 欧美乱妇15p| 免费精品视频在线| 欧美va在线| 免费福利片在线观看| 亚洲a在线观看| 欧美tickling挠脚心丨vk| 激情综合网激情| 精品国产一区二区三区2021| 日韩一区二区三区久久| 国产精品揄拍500视频| 欧美午夜片在线观看| 捆绑紧缚一区二区三区视频| 日韩成人在线一区| 激情婷婷丁香| 久久精品国产一区二区三区不卡| 亚洲老板91色精品久久| 国产亚洲成aⅴ人片在线观看| 激情婷婷综合| 1区2区3区在线视频| 岳毛多又紧做起爽| 国产精品va在线播放我和闺蜜| 欧美日韩精品福利| 99久久99久久久精品齐齐| 国产一区二区欧美| 日本视频在线| 久久99中文字幕| 国产日产欧美a一级在线| 欧美大黄免费观看| aaa国产一区| 天天影视天天精品| 男人最爱成人网| а√最新版地址在线天堂| 一区高清视频| 国产999精品久久久| 日韩精品一区二| 中文字幕亚洲精品在线观看| 欧美三级乱码| 国产美女精品视频免费播放软件| 中文字幕校园春色| 香蕉视频在线网址| 国产精品福利观看| 亚洲免费精彩视频| 欧美日韩亚洲网| 91丨九色丨国产丨porny| 国产精品s色| 红杏aⅴ成人免费视频| 韩国成人免费视频| 亚洲私人影吧| 黄色片久久久久| 色一情一乱一伦一区二区三区丨|