国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

分類模型性能度量:錯誤率與精度、查準率與查全率、P-R曲線與平衡點及F1度量的聯系與區別

發布于 2025-5-14 00:05
瀏覽
0收藏

對模型的泛化性能進行評估,不僅需要有效可行的試驗估計方法,還需要具有衡量模型泛化能力的評價標準,即性能度量。且在不同的任務中對比模型的性能時,使用不同的性能度量往往會導致不同的評判結果。在分類任務中,最常用的性能度量有錯誤率、精度、查準率、查全率、F1分數及AUC-ROC曲線。

本文將首先介紹錯誤率、精度、查準率、查全率、P-R曲線與平衡點及F1分數的詳細原理

1.錯誤率與精度

(1) 錯誤率(error rate)是分類錯誤的樣本數占樣本總數(m)的比例。計算公式可表示為:

分類模型性能度量:錯誤率與精度、查準率與查全率、P-R曲線與平衡點及F1度量的聯系與區別-AI.x社區

(2) 精度(accuracy)是分類正確的樣本數占樣本總數的比例。計算公式可表示為:

分類模型性能度量:錯誤率與精度、查準率與查全率、P-R曲線與平衡點及F1度量的聯系與區別-AI.x社區

2.查準率與查全率

(1) 二分類混淆矩陣:在二分類問題中,可將樣本根據其真實類別與模型預測類別的組合劃分為真正例、假正例、真反例與假反例四種情形。

分類模型性能度量:錯誤率與精度、查準率與查全率、P-R曲線與平衡點及F1度量的聯系與區別-AI.x社區

(2) 查準率(或準確率)定義為:在預測結果為正例的所有樣例中,預測正確(真實情況也為正例)的概率。

分類模型性能度量:錯誤率與精度、查準率與查全率、P-R曲線與平衡點及F1度量的聯系與區別-AI.x社區

(3) 查全率(或召回率)定義為:在真實情況為正例的所有樣例中,預測正確(預測結果也為正例)的概率。

分類模型性能度量:錯誤率與精度、查準率與查全率、P-R曲線與平衡點及F1度量的聯系與區別-AI.x社區

(4) 查準率與查全率是一對矛盾的變量。一般來說,查準率高時,查全率往往偏低;反之亦然。

(a) 影響兩者大小變化的關鍵在于FP和FN。

分類模型性能度量:錯誤率與精度、查準率與查全率、P-R曲線與平衡點及F1度量的聯系與區別-AI.x社區

(b) 假設分類閾值降低,則模型預測結果為正例的樣例數量將會增加(同時,模型預測結果為反例的樣例數量將會減少),此操作保證盡量不遺漏正例,即TP將會增加。

(b) 同時,此操作將會使真實情況為正例,但預測結果為反例的情況減少,即FN減少。

(c) 同時,此操作將會使真實情況為反例,但預測結果為正例的情況增加,即FP增加。

(d) 綜上所述,在分類閾值降低的情況下將會出現,TP變大、FN變小和FP變大的情況。根據查全率和查準率的比值公式可知,二者的比值將會減小。這意味著,查準率P減小了,而查全率R增大了,即二者并非同時變大或變小,而是一者增大則另一者減小。此即證明查準率與查全率的矛盾所在。

(5) 高查準率要求更嚴格的篩選,希望模型在預測正例時盡量準確,需設置較高的分類閾值,如在病情診斷中,醫生傾向于更嚴格的判斷以避免誤診(高查準率),但也可能遺漏部分真實患者(低查全率)。

(6) 高查全率需要放寬篩選,希望盡可能捕獲所有正例,需降低分類閾值,以將更多樣例標記為正例,例如,在逃犯搜捕中,警方放寬篩選條件以“寧可錯查一千”的策略(高查全率),但會誤傷大量無辜者(低查準率)。

3.P-R曲線與平衡點

(1) P-R曲線可視化了不同分類閾值下查準率與查全率的動態關系,為解決二者的矛盾,為模型調優、閾值選擇及場景適配提供了核心工具。

(2) 繪制P-R曲線

(a) 根據模型預測結果對樣例進行排序,排在前面的是模型認為“最可能”是正例的樣本,排在后面的是模型認為“最不可能”是正例的樣本。

(b) 按此順序逐個把樣本作為正例進行預測(即從大到小將每個樣本的預測結果作為分類閾值),則每次可以計算出當前的查全率和查準率。

(c) 最后以查準率為縱軸、查全率為橫軸作圖,即可得到查準率-查全率曲線,簡稱P-R曲線。

分類模型性能度量:錯誤率與精度、查準率與查全率、P-R曲線與平衡點及F1度量的聯系與區別-AI.x社區

(3) P-R曲線能直觀地顯示出模型在樣本總體上的查全率、查準率。

(a) 若一個模型的P-R曲線被另一個模型的P-R曲線完全包裹,則可斷言后者的性能優于前者。如上圖中的模型A的性能優于模型C。

(b) 若兩個模型的P-R曲線發生交叉,如上圖中的A和B,則無法直接斷定兩者孰優孰劣。一個比較合理的判斷依據則是比較P-R曲線下面積的大小,能在一定程度上表征模型在查準率和查全率上取得相對“雙高”的比例,但這個值不容易估算。

(4) 為能綜合考慮查準率、查全率的性能度量,設計了“平衡點”(Break-Event Point,BEP)這一度量。

(a) BEP是“查準率=查全率”時的取值。如上圖中模型C的BEP是0.64。

(b) 故基于BEP的比較,可以認為模型A的性能優于模型B。

(c) 但BEP過于簡化,在實際應用中具有局限性。

4.F1度量

(1)為進一步解決查準率與查全率之間的矛盾,相對于簡潔的BEP度量,F1度量更為常用。F1是基于查準率和查全率的調和平均定義的。

(2) 調和平均數?

分類模型性能度量:錯誤率與精度、查準率與查全率、P-R曲線與平衡點及F1度量的聯系與區別-AI.x社區

    (c) 相對于一般的算術平均,調和平均對較小值更為敏感。例如,若P=0.8,R=0.2,此時,調和平均值為0.32,遠低于算術平均值0.5,更能反映模型性能的真實短板。

(3) 根據調和平均的定義,可得到對于查準率和查全率的F1度量的標準形式:

分類模型性能度量:錯誤率與精度、查準率與查全率、P-R曲線與平衡點及F1度量的聯系與區別-AI.x社區

(4) F1度量的一般形式分類模型性能度量:錯誤率與精度、查準率與查全率、P-R曲線與平衡點及F1度量的聯系與區別-AI.x社區能夠體現對查準率/查全率的不同偏好,定義為:

分類模型性能度量:錯誤率與精度、查準率與查全率、P-R曲線與平衡點及F1度量的聯系與區別-AI.x社區

分類模型性能度量:錯誤率與精度、查準率與查全率、P-R曲線與平衡點及F1度量的聯系與區別-AI.x社區

分類模型性能度量:錯誤率與精度、查準率與查全率、P-R曲線與平衡點及F1度量的聯系與區別-AI.x社區

本文轉載自????南夏的算法驛站??,作者:趙南夏


收藏
回復
舉報
回復
相關推薦
亚洲免费在线视频一区 二区| 四虎影院一区二区三区| 欧美精品 日韩| 亚洲午夜免费电影| 国产精品一区二区黑丝| 99在线精品免费视频九九视| 欧美日韩一区二区三区四区不卡 | 三级黄色网址| 欧美极品欧美精品欧美| 国产精品高潮呻吟视频| 久久久亚洲影院| 在线成人免费网站| 欧美va日韩va| 91精品婷婷国产综合久久| 性久久久久久久久| 亚洲线精品一区二区三区| 国产一区视频导航| 成人激情在线| 尤物tv在线精品| 高清视频在线观看三级| 在线看的黄色网址| 欧美日韩成人一区二区三区| 99电影网电视剧在线观看| 91中文在线视频| 成人在线小视频| 97香蕉久久超级碰碰高清版| 91黄色免费观看| 欧美午夜电影在线播放| 日韩一区二区三区观看| 日韩欧美中文一区| 精品欧美激情精品一区| 亚洲一区二区视频在线观看| 色婷婷亚洲综合| 欧美日韩美女一区二区| 色综合视频在线观看| 在线精品视频小说1| 日韩午夜中文字幕| 欧美日韩久久久| 亚洲精品国产品国语在线app| 国产精品一区二区三区四区| 国产毛片精品视频| 激情综合网站| 一区在线观看视频| 99国产精品久久久久久久久久久 | 337p日本欧洲亚洲大胆色噜噜| 欧美色偷偷大香| 亚洲第一中文字幕在线观看| 欧美成人在线影院| 亚洲影院色在线观看免费| 午夜精品一区二区三区在线观看 | 2025韩国大尺度电影| 超碰在线97免费| 黄上黄在线观看| 嗯啊主人调教在线播放视频| av毛片在线免费看| 生活片a∨在线观看| 国产精品yjizz视频网| 久久亚洲精品人成综合网| 国产资源在线观看入口av| 欧美动物xxx| 老司机成人在线| 免费在线观看不卡| 极品少妇一区二区三区精品视频| 日韩中文字幕麻豆| 亚洲色图视频网站| 亚洲欧洲一区二区三区在线观看 | 免费观看在线黄色网| 91精品日本| 美女国产一区二区三区| 国内精品伊人久久久久影院对白| 99视频精品在线| 精品国产一级毛片| 九一久久久久久| 欧美国产精品中文字幕| 日韩欧美国产1| 99蜜桃在线观看免费视频网站| 亚洲综合一区二区不卡| 国产精品免费成人| 色佬视频在线观看| 精品国产不卡一区二区| 肉色丝袜一区二区| 日韩欧美亚洲一二三区| 欧美老女人xx| 国模私拍视频一区| 日韩女优中文字幕| 狠狠爱免费视频| 在线成人av观看| 国产一区二区三区四区三区四 | 97se狠狠狠综合亚洲狠狠| 一区二区高清在线| 久热精品在线视频| 一区二区不卡视频| 日本天堂在线观看| 日本在线一区二区| 在线观看一区| 国产欧美一区二区三区鸳鸯浴| 精品视频在线播放| 久久久久国产精品视频| 麻豆电影传媒二区| 亚洲女同志freevdieo| 久久国产66| 亚洲综合偷拍欧美一区色| 欧美精品video| 亚洲国产一区二区三区在线播| 伊人影院在线播放| 视频欧美精品| 国产福利91精品| 欧美日韩免费一区二区三区视频| 国产精品亚洲综合天堂夜夜| 日韩av手机版| av在线一区不卡| 2022国产精品视频| 最新亚洲国产精品| 日韩久久精品一区二区三区| 成人毛片在线观看| 亚洲精品大尺度| 91啪国产在线| 中国免费黄视频| 日韩视频网站在线观看| 国产欧美一区二区在线| 精品亚洲一区二区三区四区五区| 精品国产二区在线| 成人在线视频网| 性视频在线播放| 欧美xxxx在线| 欧美色图片你懂的| 成人在线观看av| 范冰冰一级做a爰片久久毛片| 成人免费视频一区| 中国人与牲禽动交精品| 久久久一本二本三本| 羞羞影院欧美| 一区二区三区四区精品在线视频| 国产美女扒开尿口久久久| 国产特级淫片免费看| 亚洲理论电影片| 日韩欧美aaa| 久久影视中文粉嫩av| 视频国产精品| 9191成人精品久久| 浮妇高潮喷白浆视频| 先锋资源久久| 久久激情视频免费观看| 韩国中文字幕2020精品| 国产久卡久卡久卡久卡视频精品| 亚洲精品久久7777777| wwww.国产| 日本免费一区二区视频| 91亚洲永久精品| 久久久久久a亚洲欧洲aⅴ| 国产一区二区高清在线| 亚洲精品国产精品乱码不99按摩| 国产精品久久久久久精| 成人免费毛片a| 欧美日本国产精品| 91tv精品福利国产在线观看| 97国产精品久久| 国产精品蜜月aⅴ在线| 911精品国产一区二区在线| a4yy在线播放免费观看视频| 99久久er热在这里只有精品15 | 日韩国产专区| 日本伊人精品一区二区三区介绍 | 久久精品中文字幕免费mv| 女人扒开屁股爽桶30分钟| 99国内精品久久久久| 国产女主播在线一区二区| 日韩在线观看免费高清| 久久综合伊人77777麻豆最新章节| 亚洲最大av| 中文字幕一区二区三区电影| 91人人网站| 欧美/亚洲一区| 一区二区三区视频在线| 香蕉视频色版| 日韩综合小视频| 91精品国产91久久久久福利| 国产www.大片在线| 日韩一区二区久久| 欧美激情亚洲另类| 国产成人午夜| 欧美色精品在线视频| 性刺激的欧美三级视频| 91久久午夜| 日本一区免费看| 午夜精品999| 91av视频在线播放| 91亚洲无吗| 日本一区二区三区在线播放| 4438全国亚洲精品观看视频| 日韩福利在线播放| 欧美一区国产| 国产精品国产福利国产秒拍 | 中文在线网在线中文| 国产精品第13页| 国外av网站| 日本一区二区成人在线| 丝袜足控免费网站xx网站| 中文字幕一区二区三区不卡在线 | 欧美三级电影在线播放|