国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

如何輕松檢查你的機(jī)器學(xué)習(xí)模型是否公平?

譯文
人工智能 機(jī)器學(xué)習(xí)
今天部署的機(jī)器學(xué)習(xí)模型直接影響人類和社會(huì)。由于這種力量和影響力掌握在數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)工程師的手中,花點(diǎn)時(shí)間評(píng)估和了解模型結(jié)果是否公平將成為人工智能/機(jī)器學(xué)習(xí)解決方案未來(lái)成功的關(guān)鍵。這些是至關(guān)重要的考量因素,使用最近用dalex Python軟件包開發(fā)的公平性模塊是確保模型保持公平的統(tǒng)一且可訪問的方法。

[[361220]]

【51CTO.com快譯】我們生活在日益分裂的世界。在世界上一些地區(qū),種族和性別之間的差異和不平等現(xiàn)象在加劇。用于建模的數(shù)據(jù)大體上體現(xiàn)了數(shù)據(jù)源。世界可能有偏見,因此數(shù)據(jù)和模型可能會(huì)體現(xiàn)這一點(diǎn)。我們提出了一種方法,機(jī)器學(xué)習(xí)工程師可以輕松檢查模型是否有偏見。現(xiàn)在我們的公平性工具僅適用于分類模型。

案例分析

為了表明dalex公平性模塊(https://dalex.drwhy.ai/)的功能,我們將使用著名的德國(guó)信貸數(shù)據(jù)集(https://archive.ics.uci.edu/ml/datasets/statlog+(german+credit+data)為每個(gè)信貸申請(qǐng)者賦予風(fēng)險(xiǎn)。這個(gè)簡(jiǎn)單的任務(wù)可能需要使用可解釋的決策樹分類器。

  1. # imports 
  2. import dalex as dx 
  3. import numpy as np 
  4.  
  5. from sklearn.compose import ColumnTransformer 
  6. from sklearn.pipeline import Pipeline 
  7. from sklearn.preprocessing import OneHotEncoder 
  8. from sklearn.tree import DecisionTreeClassifier 
  9.  
  10. # credit data 
  11. data = dx.datasets.load_german() 
  12.  
  13. # risk is the target 
  14. X = data.drop(columns='risk'
  15. y = data.risk 
  16.  
  17. categorical_features = ['sex''job''housing''saving_accounts'"checking_account"'purpose'
  18. categorical_transformer = Pipeline(steps=[ 
  19.     ('onehot', OneHotEncoder(handle_unknown='ignore')) 
  20. ]) 
  21.  
  22. preprocessor = ColumnTransformer(transformers=[ 
  23.         ('cat', categorical_transformer, categorical_features) 
  24. ]) 
  25.  
  26. clf = Pipeline(steps=[ 
  27.     ('preprocessor', preprocessor), 
  28.     ('classifier', DecisionTreeClassifier(max_depth=7, random_state=123)) 
  29. ]) 
  30.  
  31. clf.fit(X, y) 
  32.  
  33. exp = dx.Explainer(clf, X, y) 

一旦有了dx.Explainer,我們需要執(zhí)行方法model_fairness(),以便它可以利用protected矢量來(lái)計(jì)算子組中的所有必要度量,該矢量是一個(gè)數(shù)組或列表,列出了表明每一個(gè)觀察對(duì)象(個(gè)人)的性別、種族或國(guó)籍等方面的敏感屬性。除此之外,我們需要指出哪個(gè)子組(即protected的哪個(gè)獨(dú)特元素)具有最高特權(quán),這可以通過privileged參數(shù)來(lái)完成,本例中將是較年長(zhǎng)男性。

  1. # array with values like male_old, female_young, etc. 
  2.  
  3.     protected = data.sex + '_' + np.where(data.age < 25, 'young''old'
  4.     privileged = 'male_old' 
  5.      
  6.     fobject = exp.model_fairness(protected = protected, privileged=privileged) 

該對(duì)象有許多屬性,我們不會(huì)遍歷每一個(gè)屬性,而是著重介紹一種方法和兩個(gè)圖。

那么,我們的模型是否有偏見?

這個(gè)問題很簡(jiǎn)單,但由于偏見的性質(zhì),答案將是要看情況。但是這種方法從不同的視角來(lái)度量偏見,因此確保沒有任何有偏見的模型是漏網(wǎng)之魚。要檢查公平性,就得使用fairness_check()方法。

  1. fobject.fairness_check(epsilon = 0.8) # default epsilon 

以下內(nèi)容是來(lái)自上述代碼的控制臺(tái)輸出。

  1. Bias detected in 1 metric: FPR 
  2.  
  3. Conclusion: your model cannot be called fair because 1 metric score exceeded acceptable limits set by epsilon. 
  4. It does not mean that your model is unfair but it cannot be automatically approved based on these metrics. 
  5.  
  6. Ratios of metrics, based on 'male_old'. Parameter 'epsilon' was set to 0.8 and therefore metrics should be within (0.8, 1.25) 
  7.                    TPR       ACC       PPV       FPR       STP 
  8. female_old    1.006508  1.027559  1.000000  0.765051  0.927739 
  9. female_young  0.971800  0.937008  0.879594  0.775330  0.860140 
  10. male_young    1.030369  0.929134  0.875792  0.998532  0.986014 

FPR(誤報(bào)率)這個(gè)度量發(fā)現(xiàn)了偏見。上述輸出表明無(wú)法自動(dòng)批準(zhǔn)模型(如上述輸出中所述),因此得由用戶來(lái)決定。我認(rèn)為這不是公平的模型。較低的FPR意味著特權(quán)子組比無(wú)特權(quán)子組更容易出現(xiàn)誤報(bào)。

詳述fairness_check()

我們獲得有關(guān)偏見、結(jié)論和度量比率原始DataFrame的信息。有幾個(gè)度量:TPR(正陽(yáng)性率)、ACC(準(zhǔn)確度)、PPV(陽(yáng)性預(yù)測(cè)值)、FPR(假陽(yáng)性率)和STP(統(tǒng)計(jì)奇偶性)。這些度量來(lái)自每個(gè)無(wú)特權(quán)子組的混淆矩陣(https://en.wikipedia.org/wiki/Confusion_matrix),然后除以基于特權(quán)子組的度量值。有三種可能的結(jié)論:

  1. not fair 
  2. Conclusion: your model is not fair because 2 or more metric scores exceeded acceptable limits set by epsilon. 
  3. # neither fair or not 
  4. Conclusion: your model cannot be called fair because 1 metric score exceeded acceptable limits set by epsilon.It does not mean that your model is unfair but it cannot be automatically approved based on these metrics. 
  5. # fair 
  6. Conclusion: your model is fair in terms of checked fairness metrics. 

DA真正公平模型不會(huì)超出任何度量,但是當(dāng)真實(shí)值(目標(biāo))依賴敏感屬性時(shí),事情會(huì)變得復(fù)雜,并超出本文探討的范圍。簡(jiǎn)而言之,一些度量會(huì)不一樣,但不一定會(huì)超出用戶的閾值。如果您想了解更多,建議您閱讀《公平性和機(jī)器學(xué)習(xí)》一書(https://fairmlbook.org/),尤其是第二章。

但有人會(huì)問:為何我們的模型不公平?我們基于什么依據(jù)來(lái)決定?

回答這個(gè)問題很棘手,但到目前為止判斷公平性的方法似乎是最佳方法。每個(gè)子組的分?jǐn)?shù)通常應(yīng)接近特權(quán)子組的分?jǐn)?shù)。從數(shù)學(xué)的角度來(lái)看,特權(quán)度量和無(wú)特權(quán)度量的分?jǐn)?shù)之間的比率應(yīng)接近1。該值越接近1,表明模型越公平。但為了稍微放寬該標(biāo)準(zhǔn),這樣表述更合理:

其中ε是介于0和1之間的值,它應(yīng)該是該比率的最小可接受值。默認(rèn)情況下,它是0.8,遵循招聘中常見的五分之四規(guī)則(80%規(guī)則)。很難在度量的公平和歧視差異之間找到一個(gè)非任意邊界;檢查度量的比率是否恰好為1毫無(wú)意義,因?yàn)槿绻嚷蕿?.99會(huì)怎樣? 這就是為什么我們決定選擇0.8作為默認(rèn)的ε,因?yàn)閷?duì)于可接受的歧視程度而言,它是有形閾值的唯一已知值。當(dāng)然,用戶可以根據(jù)需要更改這個(gè)值。

偏見也可以繪出來(lái)

有兩個(gè)偏見檢測(cè)圖可用(不過有更多的方法可以直觀顯示偏見)。

  • fairness_check——直觀顯示fairness_check()方法
  • metric_scores——直觀顯示metric_scores屬性,它是度量的原始分?jǐn)?shù)。

類型只需傳遞到plot方法的type參數(shù)。

  1. fbject.plot() 

上圖顯示了與公平性檢查輸出相似的內(nèi)容。度量名已改成更標(biāo)準(zhǔn)的公平性等效項(xiàng),但是公式指出了我們引用的度量。上圖很直觀:如果條柱到達(dá)紅色區(qū)域,表示度量超出基于ε的范圍。條柱長(zhǎng)度等效于| 1-M |,其中M是無(wú)特權(quán)度分?jǐn)?shù)除以特權(quán)度量分?jǐn)?shù)(因此就像之前的公平性檢查一樣)。

  1. fobject.plot(type=’metric_scores’) 

度量分?jǐn)?shù)圖輔以公平性檢查很好地表明了度量及其比率。在這里,這些點(diǎn)是原始的度量分?jǐn)?shù)。垂直線表示特權(quán)度量分?jǐn)?shù)。離那條線越近越好。

可以將多個(gè)模型放在一個(gè)圖中,以便輕松相互比較。不妨添加幾個(gè)模型,直觀顯示metric_scores:

  1. from sklearn.ensemble import RandomForestClassifier 
  2. from sklearn.linear_model import LogisticRegression 
  3. from sklearn.preprocessing import StandardScaler 
  4.  
  5. create models 
  6. numeric_features = ['credit_amount''duration''age'
  7.  
  8. numeric_transformer = Pipeline(steps=[ 
  9.     ('scaler', StandardScaler())]) 
  10.  
  11. categorical_transformer = Pipeline(steps=[ 
  12.     ('onehot', OneHotEncoder(handle_unknown='ignore'))]) 
  13.  
  14.  
  15. preprocessor = ColumnTransformer( 
  16.     transformers=[ 
  17.         ('cat', categorical_transformer, categorical_features), 
  18.         ('num', numeric_transformer, numeric_features)]) 
  19.  
  20. clf_forest = Pipeline(steps=[('preprocessor', preprocessor), 
  21.                       ('classifier', RandomForestClassifier(random_state=123, max_depth=4))]).fit(X,y) 
  22.  
  23. clf_logreg = Pipeline(steps=[('preprocessor', preprocessor), 
  24.                       ('classifier', LogisticRegression(random_state=123))]).fit(X,y) 
  25.                        
  26.  # create Explainer objects  
  27. exp_forest  = dx.Explainer(clf_forest, X,y, verbose = False
  28. exp_logreg  = dx.Explainer(clf_logreg, X,y, verbose = False
  29.  
  30. create fairness explanations 
  31. fobject_forest = exp_forest.model_fairness(protected, privileged) 
  32. fobject_logreg = exp_logreg.model_fairness(protected, privileged)             
  33.  
  34. # lets see their metric scores 
  35. fobject.plot(objects=[fobject_forest, fobject_logreg], type = "metric_scores"

上述代碼的輸出。

現(xiàn)在不妨檢查基于fairness_check的圖:

我們可以看到RandomForestClassifier在綠色區(qū)域內(nèi),因此就這些度量而言,它是公平的。另一方面,LogisticRegression在三個(gè)度量方面抵達(dá)紅色區(qū)域,因此不能稱之為公平的。

每個(gè)圖都是交互式的,是使用python可視化包plotly繪制的。

結(jié)語(yǔ)

dalex中的公平性模塊是確保模型公平的統(tǒng)一且可訪問的方法。還有其他方法可以直觀顯示模型偏見,請(qǐng)務(wù)必查看一下!將來(lái)會(huì)增加緩解偏見的方法。長(zhǎng)期計(jì)劃是增添對(duì) individual fairness和 fairness in regression的支持。

務(wù)必看一下。您可以使用以下命令來(lái)安裝dalex:

  1. pip install dalex –U 

原文標(biāo)題:How to easily check if your Machine Learning model is fair?,作者:Jakub Wiśniewski

【51CTO譯稿,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文譯者和出處為51CTO.com】

責(zé)任編輯:華軒 來(lái)源: 51CTO
相關(guān)推薦

2019-10-23 08:00:00

Flask機(jī)器學(xué)習(xí)人工智能

2017-08-25 14:05:01

機(jī)器學(xué)習(xí)算法模型

2017-07-11 09:36:38

機(jī)器學(xué)習(xí)算法結(jié)果

2024-01-17 17:36:06

Linuxsystemd

2017-10-23 15:46:37

2017-07-13 10:12:58

機(jī)器學(xué)習(xí)

2020-09-22 14:59:52

機(jī)器學(xué)習(xí)人工智能計(jì)算機(jī)

2021-01-25 09:00:00

機(jī)器學(xué)習(xí)人工智能算法

2022-03-17 17:08:05

機(jī)器學(xué)習(xí)算法類型

2021-11-02 09:40:50

TensorFlow機(jī)器學(xué)習(xí)人工智能

2022-06-02 15:42:05

Python機(jī)器學(xué)習(xí)

2017-07-07 14:41:13

機(jī)器學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)JavaScript

2018-03-22 19:30:26

LinuxMeltdownSpectre

2017-03-24 15:58:46

互聯(lián)網(wǎng)

2023-09-19 11:41:23

機(jī)器學(xué)習(xí)視頻注釋

2020-05-26 18:35:00

機(jī)器學(xué)習(xí)人工智能AI

2021-07-29 13:06:29

Python機(jī)器學(xué)習(xí)編程語(yǔ)言

2020-04-28 10:28:30

Kubernetes操作系統(tǒng)運(yùn)維

2021-06-15 10:41:00

數(shù)據(jù)中毒機(jī)器學(xué)習(xí)網(wǎng)絡(luò)攻擊

2023-07-21 12:48:37

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

国产日韩在线视频| 色偷偷亚洲第一综合| 国产色99精品9i| 色悠久久久久综合欧美99| www婷婷av久久久影片| 欧美xxx在线观看| 久久乐国产精品| 色网在线免费观看| 在线亚洲+欧美+日本专区| 成人中文字幕av| 久久99精品国产.久久久久 | 亚洲美女黄色| av无码久久久久久不卡网站| 97精品国产| 精品少妇一区二区三区视频免付费| 中文字幕欧美日韩一区二区三区| 一本色道久久综合亚洲精品不| www亚洲精品| 日韩精选视频| 国产精品影音先锋| 老头吃奶性行交视频| 亚洲欧洲xxxx| 亚洲美女色禁图| 一区二区三区免费播放| 一区二区三区在线免费播放| 欧美精品成人网| 精品久久久久久电影| 成年人免费在线视频| 婷婷成人综合网| 久久综合狠狠综合久久综合88| 欧美黄色成人网| 丰满诱人av在线播放| 久久久精品网| 日韩av电影免费在线| 亚洲欧美一区二区三区国产精品 | 久久艳片www.17c.com| 中文字幕电影在线| 五月天国产精品| 欧美色倩网站大全免费| 电影天堂最新网址| 亚洲欧美日韩久久| 亚洲熟女乱色一区二区三区| 成人一区二区在线观看| 丁香六月婷婷| 亚洲色图色老头| 超碰aⅴ人人做人人爽欧美| 亚洲999一在线观看www| 99精品视频在线观看免费| 国产成人aa精品一区在线播放| 日韩一区二区三免费高清在线观看| 亚洲精品一区二区网址| 欧洲亚洲两性| 日韩中文在线视频| 国产亚洲观看| 国模私拍视频一区| 九九久久婷婷| 91麻豆国产语对白在线观看| 青青草国产成人a∨下载安卓| 国产精品吴梦梦| 欧美视频久久| 一本一道久久久a久久久精品91| 国内精品久久久久影院一蜜桃| 成人黄色片免费| 国产偷国产偷亚洲高清人白洁| 99re精彩视频| 在线欧美小视频| 草草影院在线| 欧美福利视频网站| 日韩欧美一区二区三区免费看| caoporen国产精品| 日韩电影在线一区二区| 在线观看污视频| 中文字幕视频一区二区三区久| 亚洲人成小说| 精品国产青草久久久久福利| 成人福利片在线| 国产美女直播视频一区| 另类激情亚洲| 无遮挡又爽又刺激的视频| 亚洲国产中文字幕在线视频综合 | 国产精品视频播放| 亚洲韩日在线| 国产一级爱c视频| 亚洲香肠在线观看| av在线网页| 欧美一级电影久久| 一本久久知道综合久久| 男人j进女人j| 亚洲色图在线视频| 制服丝袜在线播放| 欧美高清视频在线| 亚洲视频一区| 五月丁香综合缴情六月小说| 欧美lavv| 日韩视频在线一区| 国产色婷婷亚洲99精品小说| 欧美成人明星100排名| 宅男在线观看免费高清网站| 一区二区三区四区在线观看视频| 全球av集中精品导航福利| 久久久久高清| 国产偷v国产偷v亚洲高清| 超碰在线国产| 欧美老少做受xxxx高潮| 亚洲成色精品| 波多结衣在线观看| 亚洲精品在线免费观看视频| 一道本一区二区三区| 亚洲午夜精品久久久久久浪潮| 中文字幕巨乱亚洲| 538视频在线| 国产精品私拍pans大尺度在线| 国产一区二区三区美女| 日韩电影网址| 九九热99久久久国产盗摄| 老鸭窝毛片一区二区三区| 日本高清网站| 日韩亚洲综合在线| 久久人人精品| 在线观看你懂得| 欧美国产亚洲视频| 捆绑变态av一区二区三区| 伊人网站在线| 91精品国产高清自在线| 国产福利精品一区| 黄视频在线观看网站| 国产精品一区专区欧美日韩| 亚洲精品国产偷自在线观看| 久久婷婷久久| a天堂中文在线| 亚洲福利二区| 亚洲欧美第一页| 精品国产一级毛片| 毛片在线视频播放| 精品日韩在线一区| 欧美88av| 麻豆一区二区三区四区精品蜜桃| 亚洲免费一级电影| 亚洲伦理一区| 香蕉影院在线| 日本韩国在线不卡| 波多野结衣视频一区| 色图在线观看| 国产专区一区二区三区| 亚洲资源中文字幕| 福利片一区二区| 青青草国产精品视频| 亚洲精品天天看| 蜜臀精品久久久久久蜜臀| 日本高清视频在线播放| 亚洲在线观看视频| 亚洲国产综合视频在线观看| 亚洲区小说区图片区qvod按摩| 五月婷婷深爱五月| 欧美激情第99页| 国产女同性恋一区二区| 国产精品久久久久久久久久辛辛| 99久久久无码国产精品性色戒| 欧美一级在线视频| 裸体一区二区| av在线网址观看| 日韩三级电影网站| 精品国产乱码91久久久久久网站| 国产精品久久国产愉拍| 久久黄色美女电影| 视频一区二区综合| 日韩极品精品视频免费观看| 久草热8精品视频在线观看| 人成在线免费网站| 国产av国片精品| 欧美激情18p| 亚洲精品免费一二三区| 国产精品一线天粉嫩av| 又黄又爽在线免费观看| 99国产超薄丝袜足j在线观看 | 亚洲国产资源| 成人黄色片视频网站| 欧美日韩www| 美女精品一区二区| 成人涩涩视频| 天天色综合天天色| 91免费在线视频| 精品免费国产一区二区三区四区| 久久综合综合久久综合| 国产精品视频一区视频二区| 男男视频在线观看网站| 91在线视频导航| 337p日本欧洲亚洲大胆色噜噜| 国产激情一区二区三区| 伊人久久噜噜噜躁狠狠躁| 3dmax动漫人物在线看| 欧美另类视频在线| 美女少妇精品视频| 欧美日韩国产一中文字不卡| 国产精品免费看| 精品一区二区三区免费看| 在线观看免费网站| 国产成人生活片| 国产精品免费一区豆花| 亚洲国产高清福利视频|