国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

搜索引擎告訴你如何“論資排輩”

開發(fā) 前端
現(xiàn)在我們隨便搜索一些數(shù)據(jù)可能都會(huì)找到幾十、甚至上百萬條結(jié)果,如果是較為熱門的內(nèi)容甚至?xí)猩锨f條。那如何從這上千萬個(gè)網(wǎng)頁中,找到用戶最想要的、或者說是跟用戶搜索的關(guān)鍵詞最相關(guān)的網(wǎng)頁呢?這就是我們本章要探索的內(nèi)容。

在前文「??搜索引擎告訴你如何大海撈針??」中,我們簡(jiǎn)要的描述了搜索引擎是如何從成百上千億的網(wǎng)站中,快速的搜索到我們要找的內(nèi)容。但能夠搜索到結(jié)果只是搜索流程中的一部分,還有另一個(gè)很重要組成部分 —— 排序。

現(xiàn)在我們隨便搜索一些數(shù)據(jù)可能都會(huì)找到幾十、甚至上百萬條結(jié)果,如果是較為熱門的內(nèi)容甚至?xí)猩锨f條。那如何從這上千萬個(gè)網(wǎng)頁中,找到用戶最想要的、或者說是跟用戶搜索的關(guān)鍵詞最相關(guān)的網(wǎng)頁呢?這就是我們本章要探索的內(nèi)容。

如何對(duì)相關(guān)的結(jié)果排序

“相關(guān)”這個(gè)詞其實(shí)并不是一個(gè)非黑即白的量化指標(biāo),例如大家去搜索「XXX 車測(cè)評(píng)」或者「XXX 車怎么樣」的關(guān)鍵字時(shí),假設(shè)搜索到了兩篇文章:


圖片

張三、李四對(duì)XXX車的測(cè)評(píng)

其文章內(nèi)容都是在描述這款車,只是角度不同。那這兩篇文章都是符合「相關(guān)」的。

接下來我們思考一個(gè)問題:

既然兩個(gè)網(wǎng)頁都相關(guān),那誰該排在前面、誰該排在后面呢?這個(gè)排序的評(píng)判標(biāo)準(zhǔn)是啥呢?

我們可以通過“鏈接”的方式來實(shí)現(xiàn)。舉例說明,現(xiàn)在有另外的 4 個(gè)用戶 A、B、C、D,他們?cè)谀承┚W(wǎng)頁里貼了張三、李四車評(píng)網(wǎng)頁的鏈接,通過他們的鏈接,其他的用戶可以跳轉(zhuǎn)到張三、李四的網(wǎng)頁:

圖片

用戶A、B、C、D貼了張三、李四的網(wǎng)頁鏈接

可以看到,用戶 A 鏈接到了張三的網(wǎng)頁,而 B、C、D 鏈接到了李四的網(wǎng)頁,張三和李四的鏈接比例為 1:3,單從鏈接的數(shù)量這個(gè)緯度來看,搜索引擎就可以認(rèn)為李四的網(wǎng)頁應(yīng)該擁有更高的排名。

大家覺得這樣合理嗎?

可能大家還沒發(fā)現(xiàn)問題在哪兒,我把上面的圖換一下內(nèi)容,大家應(yīng)該就懂了:

圖片

用戶A、B、C、D的鏈接內(nèi)容是負(fù)面的

可以看到,雖然從鏈接數(shù)量上來看,李四更多一些,但這些內(nèi)容都是負(fù)面(咱們先善意假設(shè)這些負(fù)面內(nèi)容大概也許可能是真的)。張三雖然只有 1 個(gè)鏈接,但對(duì)其評(píng)價(jià)確實(shí)積極正面的。這個(gè)時(shí)候如果搜索引擎把李四的網(wǎng)頁排在前面肯定顯的不合適。(當(dāng)然,這里不考慮張三的網(wǎng)頁內(nèi)容質(zhì)量也很垃圾,只是找的水軍去給的好評(píng))

雖然如此,上面通過鏈接的方式也仍然有效,因?yàn)橘N鏈接更多的還是用于推薦。但用戶 A、B、C、D 卻沒有上圖中那么理想。因?yàn)楝F(xiàn)實(shí)中,用戶其實(shí)是有權(quán)重的。

引入權(quán)重

怎么個(gè)權(quán)重法呢?

舉個(gè)例子,當(dāng)一個(gè)網(wǎng)絡(luò)上的普通用戶告訴你,有個(gè)護(hù)膚的產(chǎn)品巨好用,你的內(nèi)心 OS Be like:呵呵,用你告訴我?但要是 XX琦直播間 告訴你,這個(gè)護(hù)膚的產(chǎn)品巨好用,你可能就會(huì):買它!

這就是體現(xiàn)權(quán)重對(duì)我們決策影響的一個(gè)很好的例子,把這個(gè)實(shí)例代入到上面的圖中,假設(shè)用戶 A 是類似于 XX琦直播間 的一個(gè)很資深的、廣受好評(píng)、廣受信任的車評(píng)人,那他的建議權(quán)重肯定會(huì)大于其他的普通用戶。

但,計(jì)算機(jī)并不能像人腦一樣判斷某某用戶是個(gè)大 V,他的推薦要排在前面,總歸還是需要一個(gè)量化的過程,那到底該如何量化呢?底層其實(shí)還是鏈接那一套邏輯。

假設(shè)用戶 A 是個(gè)大 V,他的主頁被很多網(wǎng)頁給鏈接了,我們假設(shè)這些“很多”網(wǎng)頁都是一些普通的網(wǎng)頁,沒有其他任何鏈接指向他們,那么這些網(wǎng)頁的權(quán)重值就是 1,那么如果有 100 個(gè)這樣的網(wǎng)頁都貼了大 V 的主頁,那么大 V 的主頁權(quán)重值就是 100,如下圖所示:

圖片

在鏈接的數(shù)量模型中加上了權(quán)重值

通過對(duì)權(quán)重值的計(jì)算我們得出,張三網(wǎng)頁的排序優(yōu)先級(jí)應(yīng)該高于李四,因?yàn)闄?quán)重值 100 > 3。

看到這里,大家是不是覺得這樣已經(jīng)能解決我們開篇的問題了。通過鏈接 + 權(quán)重的方式,能夠?qū)⑾嚓P(guān)度較高的網(wǎng)頁排在前面。

不過很遺憾,這套邏輯有個(gè)非常大的問題。

鏈接的循環(huán)引用

實(shí)際的網(wǎng)頁依賴情況可不會(huì)像上圖這么的理想、清晰、層次分明,很多的網(wǎng)頁可能會(huì)存在循環(huán)依賴的情況,比如:

圖片

網(wǎng)頁在實(shí)際的環(huán)境中可能存在循環(huán)引用

碰上這種循環(huán)我們都知道會(huì)發(fā)生什么,部分網(wǎng)頁的權(quán)重值會(huì)不停的循環(huán)、不停的增加,而這顯然是不合理的。

隨機(jī)訪問

為了解決這個(gè)問題,我們需要使用“隨機(jī)訪問”。

簡(jiǎn)要描述就是:從網(wǎng)上隨便找個(gè)網(wǎng)頁開始訪問,然后隨機(jī)點(diǎn)一個(gè)鏈接,然后跳到下一個(gè)網(wǎng)頁再執(zhí)行同樣的操作。除此之外,“隨機(jī)訪問”還有一個(gè)機(jī)制:由 15% 的概率不隨機(jī)從當(dāng)前網(wǎng)頁點(diǎn)鏈接了,而是直接跳到已經(jīng)訪問過的頁面。

麻瓜描述就是:跟我們平時(shí)“網(wǎng)上沖浪“干的事差不多,就好像大家在手機(jī)上刷 B 站,點(diǎn)一個(gè)首頁推薦視頻,然后這個(gè)視頻下面還有推薦,再點(diǎn),然后繼續(xù)看關(guān)聯(lián)的視頻,然后當(dāng)你命中了”15%“的概率,厭倦了,就瘋狂右滑回到首頁,繼續(xù)點(diǎn)其他的視頻,再重復(fù)這個(gè)過程。

然后,這套算法會(huì)記錄每個(gè)網(wǎng)頁被訪問的次數(shù)。因?yàn)槭请S機(jī)訪問,所以當(dāng)某個(gè)網(wǎng)站被其他的網(wǎng)站引用越多,它被訪問到的概率就越大。而這個(gè)被訪問的次數(shù),就是它的權(quán)重了。

由于整套的隨機(jī)訪問是有總次數(shù)的限制,并且即使網(wǎng)頁之間的鏈接依賴存在循環(huán),也不會(huì)導(dǎo)致權(quán)重?zé)o限次的增加,因?yàn)橛?15% 的概率重訪問。這樣一來就能能夠解決上面的死循環(huán)問題。本質(zhì)上,隨機(jī)訪問的底層邏輯還是依賴權(quán)重的思想,只不過權(quán)重的計(jì)算模式稍微換了一下。

總結(jié)

上面這一套算法也叫 PageRank,由 Google 的兩位創(chuàng)始人拉里·佩奇(Larry Page)和謝爾蓋·布林(Sergey Brin)在 1998 年的一篇論文《The Anatomy of a Large-Scale Hypertextual Web Search Engine》中提出。Page 是一語雙關(guān),它既是創(chuàng)始人的名字,也代表網(wǎng)頁的排序。

只不過實(shí)際中的情況肯定只會(huì)更復(fù)雜,所以實(shí)際的隨機(jī)訪問算法和上面描述的略有不同。舉個(gè)例子,我想要推廣我的網(wǎng)頁 XX,那我可以搞一堆其他的無關(guān)緊要的網(wǎng)頁,在里面鏈上網(wǎng)頁 XX 的地址,以此來刷權(quán)重值,而這明顯是不符合預(yù)期的。并且,成百上千億的網(wǎng)頁,如果真的要運(yùn)行隨機(jī)訪問算法,耗時(shí)可想而知,所以 PageRank 并不能被實(shí)際應(yīng)用。并且實(shí)際的生產(chǎn)場(chǎng)景,不可能只通過這一個(gè)緯度來評(píng)判網(wǎng)頁的重要性。

不過,PageRank 的核心思想 —— 網(wǎng)頁權(quán)重值的傳遞仍然是有效的。

責(zé)任編輯:姜華 來源: SH的全棧筆記
相關(guān)推薦

2023-01-11 09:37:37

搜索引擎排序

2022-10-08 09:13:18

搜索引擎?站

2011-06-20 18:23:06

SEO

2009-07-30 10:40:56

搜索引擎優(yōu)化網(wǎng)站

2017-08-07 08:15:31

搜索引擎倒排

2025-08-04 07:47:44

2015-08-31 10:41:58

搜索引擎Google云應(yīng)用

2025-02-28 01:00:00

2022-03-31 20:15:21

圖像搜索引擎

2020-03-20 10:14:49

搜索引擎倒排索引

2012-09-07 13:22:21

搜索搜狗

2009-02-19 09:41:36

搜索引擎搜狐百度

2010-04-20 11:43:46

2010-09-01 16:45:28

2009-09-22 16:23:52

搜索引擎

2017-08-21 11:14:36

2010-03-11 19:06:52

Python編程語言

2010-06-13 16:27:28

搜索引擎

2023-01-03 15:42:29

機(jī)器學(xué)習(xí)視頻搜索

2022-02-24 00:07:22

Shodan網(wǎng)絡(luò)搜索
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

日本不卡一区二区| 免费一区二区三区在线视频| 日韩av一二三| 欧美在线一区二区三区四| aaaaaaa大片免费看| 亚洲激情成人| 国产日韩av在线| 精品国产一区二区三区性色av | 国产网站观看9久| 久久99久久精品| 国产自产在线视频一区| 超碰97成人| 色偷偷综合社区| 国产高清在线精品一区二区三区| 精品中文字幕一区二区三区av| 亚洲毛片一区二区| av在线麻豆| 欧美高清视频在线高清观看mv色露露十八| chinese少妇国语对白| 精品一二三四区| 日韩电影大全在线观看| 99热这里只有精品8| 国产精品第10页| jizzjizzjizz欧美| 蜜臀久久99精品久久久久久宅男| 黑人精品一区| 欧洲激情视频| 欧美日韩一区二区三区不卡| 精产国品自在线www| 久久一区二区三区超碰国产精品| 国产麻豆乱码精品一区二区三区 | 欧美午夜片在线免费观看| 最近中文字幕在线中文视频| 亚洲第一激情av| 日韩免费网站| 精品无人国产偷自产在线| 国产精品一级在线观看| 国产成人在线一区| 欧美日韩三级| 少妇久久久久久被弄到高潮| 亚洲免费观看高清完整| 国产高清一级毛片在线不卡| 亚洲毛片一区二区| 超碰97久久国产精品牛牛| 庆余年2免费日韩剧观看大牛| 成人激情在线| 久久综合给合久久狠狠色| 粉嫩av一区二区三区在线播放 | 北条麻妃国产九九九精品小说| 成人国产精品一区二区| 久久婷婷久久| 97操碰视频| 91精品国产综合久久国产大片| 国产激情在线播放| www.久久草.com| 国产女同一区二区| 另类调教123区| 欧美知名女优| 中日韩美女免费视频网址在线观看| 亚洲另类春色校园小说| 自拍偷拍一区二区三区| 亚洲成人一区二区| av激情成人网| 四虎一区二区| 五月婷婷激情综合| 成人中文字幕视频| 亚洲一卡二卡三卡四卡无卡网站在线看| 亚洲人成亚洲人成在线观看图片| 青草视频在线免费直播| 成人精品福利视频| 91久色porny| 最新日韩一区| 欧美三日本三级少妇三99| 狠狠久久亚洲欧美专区| 日韩精品一区二区三区免费观影| www.在线观看av| 国产偷亚洲偷欧美偷精品| 国产精品草草| 国产一区精品| 99久久伊人精品影院| 亚洲综合视频在线| 国产免费久久| 夜色资源站国产www在线视频| 2020久久国产精品| 丁香网亚洲国际| a屁视频一区二区三区四区| 一区二区三区高清国产| 每日更新在线观看av| 国产三级三级三级精品8ⅰ区| 亚洲婷婷影院| 欧美成人在线影院| 在线看片欧美| 欧美亚洲大陆| av日韩亚洲| 1stkiss在线漫画| 日韩专区一区二区| 2019一级黄色毛片免费看网| 国产精品视频一二三四区| 成人久久18免费网站漫画| 日韩免费不卡av| 日韩亚洲电影在线| 国产欧美日韩在线观看| 精品亚洲国产成人av制服丝袜| 日韩中文欧美| 精品一区二区三区四区五区| 亚洲资源一区| 伊人免费在线| 中文资源在线网| 91色国产在线| 欧美大黑帍在线播放| 国产激情一区二区三区在线观看 | 成人美女黄网站| 黄在线免费观看| 精品无人区一区二区三区竹菊| 久久久久久久国产精品影院| 国产视频久久| 亚洲欧美日韩精品一区二区 | 91精品国产高清久久久久久91 | 欧美日本国产| 欧美日韩国产在线观看网站| 视频免费一区二区| 亚洲精品国产嫩草在线观看| 青草在线视频在线观看| 成人影院大全| 免费欧美网站| 亚洲综合影院| 欧美三级日本三级少妇99| 亚洲伊人伊色伊影伊综合网| 中文字幕国产一区| 久久久国产综合精品女国产盗摄| 国产成人av影院| 成人三级在线视频| 国产欧美日韩精品a在线观看| 国产成人自拍在线| 成人免费av资源| 国产色婷婷亚洲99精品小说| 国产精品久久久久婷婷| 欧美日韩免费高清一区色橹橹 | 欧美电影完整版在线观看| 欧美亚洲国产激情| 亚洲美女一区| 午夜激情久久| 日韩影片在线观看| 日本综合在线| h网站在线免费观看| 伊人国产在线| 诱人的瑜伽老师3hd中字| 六月丁香婷婷激情| 91在线国产电影| 97人人做人人人难人人做| 国产精品福利久久久| 91精品久久久久久久久久久久久| 欧美激情xxxx性bbbb| 国产国语videosex另类| 成人欧美一区二区三区黑人| 国产精品我不卡| 久久综合一区二区三区| 成人永久aaa| 亚洲福利天堂| 一区二区电影| aⅴ色国产欧美| 久久99精品国产麻豆婷婷洗澡| 激情都市一区二区| 国产精品18久久久久| 亚洲欧洲精品一区二区精品久久久| 国产精品久久久久久久岛一牛影视 | 日韩成人高清| 日本欧美高清| 亚洲每日在线| 91在线码无精品| 午夜精品福利视频网站| 欧美一级片在线看| 中文字幕日韩精品在线观看| 国产精品678| 伊人色综合久久天天五月婷| 黄色片久久久久| 啊v视频在线| 成人豆花视频| 亚洲综合精品四区| 欧美高清在线视频| 日韩欧美国产一二三区| 午夜精品一区二区三区视频免费看| 3d蒂法精品啪啪一区二区免费| 日韩欧美视频免费在线观看| 米奇在线777| 成人影院入口| 亚洲精一区二区三区| 国产精品久久久久久久久动漫| 精品国产乱码久久久久久图片| 成人www视频在线观看| 青青在线视频免费| 欧产日产国产精品视频| 亚洲三级色网| 福利视频导航一区| 国内精品一区二区三区四区| 久久成人福利视频| 漫画在线观看av| 午夜在线a亚洲v天堂网2018| 动漫精品一区二区| 国产成人精品网站|