?譯者 | 崔皓
審校 | 孫淑娟
開篇

機器學(xué)習(xí)被企業(yè)應(yīng)用到不同的業(yè)務(wù)場景解決不同的業(yè)務(wù)問題,隨著機器學(xué)習(xí)的廣泛應(yīng)用也讓組織在選擇學(xué)習(xí)方法時不堪重負(fù)。
很多組織在機器學(xué)習(xí)的應(yīng)用中使用了高級和經(jīng)典的學(xué)習(xí)方法。有大家熟悉的監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)二分法,還有例如對比學(xué)習(xí)、強化學(xué)習(xí)和自我監(jiān)督學(xué)習(xí)等機器學(xué)習(xí)的新興變體。
此外,還有涉及圖形分析、深度神經(jīng)網(wǎng)絡(luò)、分割、行為分析和其他技術(shù)。當(dāng)面對大規(guī)模復(fù)雜業(yè)務(wù)問題時——例如加強反洗錢措施從而打擊金融犯罪——組織如何決定使用哪種機器學(xué)習(xí)的方法呢?
使用集成建模,讓這個問題變得不那么重要了。這種機器學(xué)習(xí)方法使組織能夠利用各種模型并將它們與預(yù)測準(zhǔn)確性結(jié)合起來,從而獲得最佳結(jié)果。
這種方法幫助金融服務(wù)、欺詐檢測和網(wǎng)絡(luò)安全中的高維數(shù)據(jù)提供完整上下文。使用集成建模的組織表示“集成建模讓模型的建立更加多樣化“,Resistant AI首席執(zhí)行官Martin Rehak 承認(rèn),“我們并不希望單一模型一枝獨秀。”
使用模型的多樣性使組織能夠用不同的算法來評估業(yè)務(wù)問題的各個方面,以便采用完全知情的、一致的決策方法——這些方法是可以解釋的。
基于共識的模型決策
前面提到的集成建模的原理是毋庸置疑的,數(shù)據(jù)科學(xué)家無需花費大量時間來為業(yè)務(wù)案例設(shè)計完美的模型,只需要將那些不完美的模型組合起來產(chǎn)生預(yù)測能力。“當(dāng)你以集成方法看待機器學(xué)習(xí)時,你會從小型算法中做出決策,”Rehak 指出。“而且,在我們的案例中,這些算法是針對每筆交易動態(tài)組合的,以便做出最佳決策。” 更重要的是,也許這些模型中的每一個都可以專注于某一個垂直領(lǐng)域,例如識別洗錢事件。
例如,一種模型只專注于交易的規(guī)模。另一個模型專注于交易的位置。不同的模型可以檢查出哪些特定參與者參與了交易。目標(biāo)是“沒有出現(xiàn)任何峰值”的情況,Rehak 解釋說。“模型的分布非常平坦,與模型對應(yīng)的證據(jù)頁相對較弱。通過結(jié)合許多弱證據(jù)元素,就能夠做出更強有力的決定。” 另一個好處是,通過經(jīng)典的機器學(xué)習(xí)和更簡單的模型,將模型投入生產(chǎn)所需的訓(xùn)練數(shù)據(jù)(和注釋)減少。這樣的模型比需要大量訓(xùn)練數(shù)據(jù)的深度神經(jīng)網(wǎng)絡(luò)更容易解釋。
上下文建模
將 Rehak 所描述的分布平坦的建模方式與其他集成建模技術(shù)區(qū)分開來是很重要的。最常見的集成建模示例涉及 bagging 或boosting?(后者可能需要 Xtreme Gradient Boosting)。隨機森林是一個基于不同決策樹組合的提升示例。使用這種方法,“你可以根據(jù)集合中的先前版本一個一個地構(gòu)建集合,”Rehak 評論道。盡管它是一種快速構(gòu)建具高預(yù)測準(zhǔn)確性的模型方法,但它存在過度擬合的風(fēng)險(由于訓(xùn)練數(shù)據(jù)集太小,導(dǎo)致模型變得不太適用于生產(chǎn)數(shù)據(jù))。
Rehak 的集成方法更適合 AML 用例,因為它基于影響這些事件的上下文。“如果您詢問洗錢專家交易是否惡意,他們首先是查看賬戶的歷史以及該人過去的行為方式,”雷哈克說。通過他的方法,與地理位置、時間、相關(guān)方和金融機構(gòu)等相關(guān)因素,使用單獨的機器學(xué)習(xí)模型進行檢查。只有將這些模型的每個結(jié)果組合在一起,人工智能系統(tǒng)才能確定是否存在犯罪交易,通過這種做法的誤報會明顯減少。“通過機器學(xué)習(xí)可以解釋大多數(shù)異常值,否則海量的異常值會淹沒反洗錢團隊,”雷哈克說。
決策邊界
在用例進行集成建模時,使用超過 60 個模型針對分析交易的不同方面進行建模是常見的事情。集成方法的實時結(jié)果非常適合這種應(yīng)用場景。“這 60 種算法中的一種可以將所有內(nèi)容分割成段,然后對每秒平均事務(wù)大小進行建模,”Rehak 透露。“我們可以有數(shù)千個片段,這些片段都是同時動態(tài)更新的。”
由于將大量模型整合到集合中,每個模型都會評估交易的不同方面從而發(fā)現(xiàn)潛在的犯罪行為,除此之外再不能創(chuàng)建更全面的方法了。Rehak 透露:“我們從多個角度看待你,以至于塑造你行為的同時讓你避免所有這些犯罪行為變得非常困難。”“因為,為了不被識別出來,“犯罪分子”需要避免的不止一個決策邊界,而是大量動態(tài)的決策邊界。這些算法中的每個模型都是獨立學(xué)習(xí)的,然后我們將它們組合在一起。”
可解釋的人工智能
這些集合如何增強可解釋性以及所對應(yīng)的許多方面。 首先,他們沒有過度依賴先進的機器學(xué)習(xí),只包含簡單、更可解釋的算法(涉及傳統(tǒng)機器學(xué)習(xí))。這些模型成為評估交易犯罪的基石。“當(dāng)我們說某件事很重要時,我們可以告訴你原因,”雷哈克說。“我們可以告訴你哪些指標(biāo)表明了這一點。我們可以針對為每個發(fā)現(xiàn)寫一份報告,指出由于這些因素會造成交易犯罪的高風(fēng)險。” 盡管每種算法都專注于特征,但并非所有算法在模型中都具有相同的權(quán)重。一般而言,涉及圖形分析(擅長檢查關(guān)系)的算法??比其他模型具有更大的權(quán)重。
模型不僅可以解釋可疑的行為,也可以告訴你異常值出現(xiàn)的原因。“通常我們在集成中有四到五個占主導(dǎo)地位的算法,也就是說當(dāng)我相信這是一個異常值時由于有算法的支撐,其他人也會表示同意,”Rehak 指出。“而且,我們有四五個觸發(fā)因素,這就保證了在某種程度上使結(jié)果更偏向于異常。” 由于單個模型僅評估交易中的一個因素,因此它們提供了分?jǐn)?shù)的可解釋性和單詞的可解釋性。“因為我們知道集合,知道微分段,還知道交易量,我們可以很容易地在分?jǐn)?shù)旁邊通過問題顯示這些信息,而交易量對一家公司的財務(wù)部門非常重要,”雷哈克補充道。
集成模式
最終,集成建模的使用效果超過了任何一種應(yīng)用程序,盡管它對 AML 活動有巨大的幫助。如果應(yīng)用得當(dāng),該技術(shù)可以提高可解釋性,同時減少解決業(yè)務(wù)關(guān)鍵問題所需的訓(xùn)練數(shù)據(jù)和注釋數(shù)量。
集成建模利用各種數(shù)據(jù)科學(xué)技術(shù)來解決多種業(yè)務(wù)問題,而不是將問題限制在一個或兩個。因此,這種集成解決問題的方法可能會成為AI 部署的典型代表。
譯者介紹
崔皓,51CTO社區(qū)編輯,資深架構(gòu)師,擁有18年的軟件開發(fā)和架構(gòu)經(jīng)驗,10年分布式架構(gòu)經(jīng)驗。曾任惠普技術(shù)專家。樂于分享,撰寫了很多熱門技術(shù)文章,閱讀量超過60萬。《分布式架構(gòu)原理與實踐》作者。
原文標(biāo)題:???Machine Learning Model Management: Ensemble Modeling???































