国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

小白都能懂的推薦算法入門之一,從上古時期的LR開始聊起

開發 前端 算法
既然是介紹推薦系統,我們先從最簡單最簡單的模型開始說起。說起推薦算法領域最簡單的模型,自然就是LR了。

[[386397]]

大家好,不知不覺做推薦系統挺久的了,很多同學私信讓我好好寫寫推薦系統相關,但苦于沉淀不夠有貨倒不出。最近充電總結了一段時間,有了一些積累,給大家好好說道說道。

既然是介紹推薦系統,我們先從最簡單最簡單的模型開始說起。說起推薦算法領域最簡單的模型,自然就是LR了。

LR模型是機器學習領域的基礎模型,我想接觸過這個領域的同學應該都不陌生。

為什么是LR

什么是LR大家已經知道了,但還有一個問題卻沒有回答。那就是為什么早年的時候LR模型如此受歡迎呢?難道就不能使用其他一些看起來高級一些的模型嗎,比如決策樹、隨機森林、GBDT?不是說XGBoost在各種比賽的效果都非常好嗎?為什么業內不用來做推薦呢?

尤其是當我讀到2014年Facebook推出的GBDT+LR的paper的時候,這種困惑更是明顯。

這篇論文非常經典,在業內地位很重,甚至可以說是推薦領域必讀的paper之一。深度學習興起之前很多公司和廠商都沿用了這個做法,論文當中的做法倒是不難,說是創新的做法,其實本質上就是將GBDT預測的時候樣本落到的節點作為multi-hot編碼,然后將這個編碼之后的01的數組看成是新的特征,然后用這個轉換過的特征來訓練LR。可以說它的本質仍然是訓練LR,所謂的GBDT只不過是一個編碼器。

我當時看這篇paper的時候,里面的意思都已經理解了,但是有一個問題怎么也沒想明白。既然都用GBDT了,結合其他模型不香嗎,非得結合LR?

我估計這個問題很多在推薦領域的從業者可能也未必答得上來,我先賣個關子,把問題記在這里,等會晚點來回答。

推薦領域的特征有什么特點?

在算法領域,提及效果,特征和模型兩者是一體兩面,很難剝離。好的模型也需要好的特征支撐,好的特征需要好的模型才能充分表達。所以我們先把模型的問題放一放,來思考一下特征。

推薦領域主要的特征只有三塊,以電商為例,分別是item,user和context。也就是商品,用戶以及環境信息,比如時間,地點,展示位置等等。context特征比較少,來來回回就那么幾樣,我們也先放一放。剩下的就是用戶和商品,圍繞用戶和商品我們形成的特征主要又可以分成兩個部分,一個是基礎特征,另外一個是統計特征。

以商品舉例,基礎特征就是品牌、價格、類目、評價,統計特征就是最近點擊率、最近銷售額、最近轉化率等等。這些特征按照類別分又可以分為兩種,一種是浮點型的連續型特征,一種是類別特征,比如商品的類目,品牌等等。到這里都很正常,沒有什么難理解,或者是不可思議的部分。

我們接著往下,再來看看模型要預測的目標——點擊率。我們結合一下模型預測的目標再來觀察一下前面列舉的特征,你會發現,除了歷史點擊率、歷史轉化率等少數幾個指標和最終的結果是強正相關之外,其他的浮點型的特征沒有特別明顯的正相關或者是負相關。可以說商品的價格和點擊率負相關嗎?其實不太行,商品越便宜可能質量越差,反而不會有人點。用戶的購買力呢?越有錢點的商品越多嗎?也不成立。

正是因為上面說的這個原因,所以在推薦領域,效果很好的浮點型特征很少,大部分都是類別特征,也就是01特征。

所以你說GBDT、隨機森林、XGboost這些模型的效果會很好嗎?很難說,因為這些模型的長處往往都在浮點型特征,也就是連續型特征。這些樹模型會設計規則對這些連續特征進行分段,如果大部分特征都是01特征,那還怎么分段呢?

所以,到這里也就回答了,為什么在深度學習模型興起之前,推薦領域普遍都使用LR,而不是那些看著很牛的樹模型。

LR模型的原理

LR模型也就是純線性模型,它可以簡單理解成若干個特征的加權和。每個特征的權重或大或小,最后累加在一起,得到一個預測的概率。這毫無毛病,也是學過的人都知道。

但我們往下一層,有沒有想過這一點在推薦領域意味著什么呢?

意味著模型其實是”記住“了每個特征和最終結果的關系,我們把模型擬人化,把它看成一個機器人的話。機器人看到樣本有特征A并且點擊了,于是特征A的權重提升一點,樣本有特征B但是沒點擊,于是把特征B的權重降低一些。模型就是在這樣一個策略當中找到一個最佳的平衡。

這就意味著,一些容易被記憶的特征往往會發揮比較好的效果。比如男士通常會買煙,女士通常買口紅,那么我們就可以設計男士_煙和女士_口紅的組合特征。當模型看到大部分男士看到煙都點擊了之后,它就能學到這個組合是一個強特征并給與一個比較高的權重。這樣只要我們盡可能地找出這些特征的組合,那么模型就可以得到很好的效果。

所以到這里大家就明白了,LR模型在推薦領域發揮作用,本質上就是靠的“記性”。因為它可以記住那些類別特征以及類別特征的組合,所以它往往比那些看起來更高端的樹模型效果要好。這也是為什么到了LR時代的后期,算法工程師們的工作就是整天挖掘一些類別特征的組合,以期望模型達到很好的效果。

LR模型的優缺點

到這里,關于LR模型在推薦領域的應用就差不多說完了,我們做一個簡單的總結,首先從它的優點開始說起。

LR模型的優點教科書上已經說了很多了,比如訓練速度快,由于參數空間比較小,LR模型可以迅速收斂,它的訓練速度要比那些樹模型以及后面的深度學習模型快得多。其次是可解釋性強,由于我們可以查閱得到所有特征的權重,所以我們很容易解釋究竟是什么特征發揮了作用,或者是什么特征拖了后腿。

但是LR在推薦領域也有一個很大的缺點,是什么呢,就是臟活累活很多。

因為幾乎所有的特征組合都需要人工挖取,需要人工遍歷很多特征組合,甚至是一一嘗試找到最佳的組合。這個過程當中需要花費大量的人力,幾乎可以說是純堆人工。所以對于LR時代的算法工程師來說可能螺絲釘的感覺比現在還要嚴重得多,什么優化模型基本上是不用想了,LR這么簡單的模型也沒什么優化的空間,剩下的事情基本上就只有做特征做實驗了。

 

俗話說得好,前輩的缺點就是后輩努力的方向。那么對于LR模型的這些缺點又該怎么彌補或者是優化呢?

本文轉載自微信公眾號「TechFlow」,可以通過以下二維碼關注。轉載本文請聯系TechFlow公眾號。

 

責任編輯:武曉燕 來源: TechFlow
相關推薦

2023-03-09 08:17:46

Google存儲設備

2021-03-18 11:45:49

人工智能機器學習算法

2020-05-19 14:00:09

人工智能機器學習AI

2021-09-06 08:39:24

容器Docker鏡像

2021-01-11 05:18:11

機器學習

2021-07-01 07:34:09

代碼 Python 視頻

2014-09-11 09:42:35

VLAN原理

2019-12-17 14:59:27

數據中臺數據倉庫馬蜂窩

2021-06-29 11:40:51

Python郵件命令

2021-06-28 06:15:14

算法Algorithm時間空間復雜度

2021-12-30 09:10:28

游戲開發開發技術熱點

2024-10-07 10:45:12

2023-01-13 08:18:37

延遲雙刪策略

2022-08-16 21:01:56

runAsyncreload數據

2018-04-08 16:03:16

2016-09-30 15:03:13

推薦系統算法

2017-12-20 10:08:53

2014-04-24 16:40:36

敏捷網絡華為

2024-12-18 18:53:48

2024-11-22 10:45:20

點贊
收藏

51CTO技術棧公眾號

97超级碰碰| 亚洲少妇中文在线| av在线观看地址| 另类av一区二区| 国产精品久久久久久久久免费 | 日韩一区二区在线看| 老司机在线免费视频| 国产黑丝在线一区二区三区| 欧美一区观看| 国产精品日韩久久久| 成人18视频| 欧美一区不卡| y111111国产精品久久婷婷| 91麻豆国产自产在线观看亚洲| 91chinesevideo永久地址| 国偷自产av一区二区三区| 欧美激情aaaa| av综合网站| 欧美最顶级的aⅴ艳星| 日韩欧美黄色| 国产精品美腿一区在线看| 一区二区美女| 91tv亚洲精品香蕉国产一区7ujn| 日韩超碰人人爽人人做人人添| 97在线视频一区| 国产乱码精品一区二区亚洲| 国产精品久久久久久av福利软件| 欧美一区电影| 国产精品18毛片一区二区| 亚洲精品免费观看| 欧美一区亚洲二区| 国产一区二区三区香蕉| 777av视频| 中文字幕日韩精品一区| 黄动漫在线免费观看| 日韩欧美成人精品| 免费**毛片在线| 亚洲欧美精品在线| 日韩在线激情| 国产精品成人国产乱一区 | 九九九久久国产免费| 国产精品毛片av| 国产精品中文字幕在线| 在线日韩电影| 精品一区二区成人免费视频 | 99re在线| 日本不卡高清视频| 少妇av一区二区三区无码| 欧美国产精品一区| 女人偷人在线视频| 亚洲国产天堂网精品网站| 国产一区二区高清在线| 国产精品极品在线| 久久综合亚州| aa免费在线观看| 午夜精品影院在线观看| 亚洲性图自拍| 久久噜噜噜精品国产亚洲综合| 中文字幕人成人乱码| 男女激烈动态图| 亚洲综合图片区| 男女视频在线| 欧美一级免费视频| 日韩制服丝袜先锋影音| 久久国产色av免费观看| 福利微拍一区二区| 丝袜美腿一区| 亚洲mm色国产网站| 成人免费毛片高清视频| 日本在线视频1区| 亚洲午夜色婷婷在线| 精品亚洲成人| 久久99国产精品一区| 成人欧美一区二区三区1314| 91大神在线网站| 欧美国产极速在线| 国产亚洲在线观看| 五月综合激情在线| 亚洲高清在线观看| 日韩在线综合| 成熟丰满熟妇高潮xxxxx视频| 色香蕉久久蜜桃| 日韩伦理一区二区| 麻豆成人av| 亚洲一区二区三区四区五区中文| 欧美私密网站| 亚洲自拍偷拍区| 欧美国产一区二区| brazzers在线观看| 亚洲xxx自由成熟| 国产亚洲短视频| 欧美6一10sex性hd| 国产综合在线观看视频| 91丨九色丨蝌蚪富婆spa| 幼a在线观看| 国产精品黄页免费高清在线观看| 亚洲2020天天堂在线观看| 久久精品国产在热久久| wwwav91| 欧美图区在线视频| а√在线中文网新版地址在线| 欧美xxxx14xxxxx性爽| 动漫3d精品一区二区三区乱码| 亚洲一级片在线看| 亚洲国产高清一区二区三区| 狠狠躁狠狠躁视频专区| 亚洲国产成人精品久久久国产成人一区| 黑丝美女一区二区| jizzjizzxxxx| 亚洲国产中文字幕在线观看 | 91精品国产全国免费观看| 亚洲欧美日本伦理| 亚洲乱码日产精品bd在线观看| 91精品国产乱码| 亚洲性图久久| 在线视频1区| 欧美洲成人男女午夜视频| 国产成人亚洲综合色影视| 污视频网站在线免费| 99在线观看视频网站| 亚洲图片欧美一区| 亚洲警察之高压线| 视频二区在线播放| 久久免费观看视频| 99精品视频一区二区三区| 性欧美freehd18| 中文字幕日韩精品无码内射| 欧美v亚洲v综合ⅴ国产v| 亚洲国产精品第一区二区| 最近2018年手机中文在线| 欧美性做爰毛片| 综合亚洲深深色噜噜狠狠网站| 欧美三级电影在线| 亚洲最大成人在线观看| 久久在精品线影院精品国产| 国产成人精品免费一区二区| 超碰aⅴ人人做人人爽欧美| 性欧美videosex高清少妇| 日韩午夜精品视频| 首页综合国产亚洲丝袜| 在线免费观看污| 色爱区成人综合网| 精品久久久久久久一区二区蜜臀| 国产精品视区| 超碰免费在线播放| 香蕉久久夜色| 亚洲天堂av在线免费| 豆国产96在线|亚洲| 成人黄色免费观看| 欧美性久久久久| 久久久久久12| 亚洲午夜久久久久| 欧美 日韩 国产一区二区在线视频| 青青草在线视频免费观看| 91视频免费进入| 91麻豆精品国产91久久久更新时间| 国产亚洲精品v| 中文在线免费视频| 一女被多男玩喷潮视频| 九九热精品视频在线播放| 欧美男人天堂| 久久久久久久久久久久久久国产| 91亚洲va在线va天堂va国| 亚洲精品欧美激情| 免费精品国产| 特黄国产免费播放| 国内精品久久久久久久久| 欧美一区自拍| 在线观看日韩av| 99精品视频一区| 久久成人福利| 天堂а√在线8种子蜜桃视频| 99精品在线直播| 亚洲精品按摩视频| 国产日本欧洲亚洲| 欧洲美女日日| 综合久久2019| 欧美少妇性生活视频| 国产精品视频一区二区高潮| 欧美日韩国产欧美日美国产精品| 精品影视av免费| 一区二区三区视频免费视频观看网站 | 欧美在线一区视频| 日本不卡高字幕在线2019| 欧美视频二区36p| 琪琪一区二区三区| 欧洲大片精品免费永久看nba| 91网在线观看| 正在播放一区| 日韩av日韩在线观看| 日韩午夜中文字幕| 在线播放中文字幕| 俄罗斯av网站| 久久99精品久久久久久琪琪| 欧美日韩综合不卡| a在线欧美一区| 99亚洲伊人久久精品影院红桃| 大陆精大陆国产国语精品| 国产精品麻豆一区二区三区| 狠狠v欧美ⅴ日韩v亚洲v大胸 |