国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

rsync 的核心算法

運維 系統運維 算法
rsync是unix/linux下同步文件的一個高效算法,它能同步更新兩處計算機的文件與目錄,并適當利用查找文件中的不同塊以減少數據傳輸。rsync中一項與其他大部分類似程序或協定中所未見的重要特性是鏡像是只對有變更的部分進行傳送。rsync可拷貝/顯示目錄屬性,以及拷貝文件,并可選擇性的壓縮以及遞歸拷貝。

rsync是unix/linux下同步文件的一個高效算法,它能同步更新兩處計算機的文件與目錄,并適當利用查找文件中的不同塊以減少數據傳輸。rsync中一項與其他大部分類似程序或協定中所未見的重要特性是鏡像是只對有變更的部分進行傳送。rsync可拷貝/顯示目錄屬性,以及拷貝文件,并可選擇性的壓縮以及遞歸拷貝。rsync利用由Andrew Tridgell發明的算法。這里不介紹其使用方法,只介紹其核心算法。我們可以看到,Unix下的東西,一個命令,一個工具都有很多很精妙的東西,怎么學也學不完,這就是Unix的文化啊。

 
本來不想寫這篇文章的,因為原先發現有很多中文blog都說了這個算法,但是看了一下,發現這些中文blog要么翻譯國外文章翻譯地非常爛,要么就是介紹這個算法介紹得很亂讓人看不懂,還有錯誤,誤人不淺,所以讓我覺得有必要寫篇rsync算法介紹的文章。(當然,我成文比較倉促,可能會有一些錯誤,請指正)
 
問題
 
首先, 我們先來想一下rsync要解決的問題,如果我們要同步的文件只想傳不同的部分,我們就需要對兩邊的文件做diff,但是這兩個問題在兩臺不同的機器上,無法做diff。如果我們做diff,就要把一個文件傳到另一臺機器上做diff,但這樣一來,我們就傳了整個文件,這與我們只想傳輸不同部的初衷相背。
 
于是我們就要想一個辦法,讓這兩邊的文件見不到面,但還能知道它們間有什么不同。這就出現了rsync的算法。
 
算法
 
rsync的算法如下:(假設我們同步源文件名為fileSrc,同步目的文件叫fileDst)
 
 
1)分塊Checksum算法。首先,我們會把fileDst的文件平均切分成若干個小塊,比如每塊512個字節(最后一塊會小于這個數),然后對每塊計算兩個checksum,
 
一個叫rolling checksum,是弱checksum,32位的checksum,其使用的是Mark Adler發明的adler-32算法,
另一個是強checksum,128位的,以前用md4,現在用md5 hash算法。
為什么要這樣?因為若干年前的硬件上跑md4的算法太慢了,所以,我們需要一個快算法來鑒別文件塊的不同,但是弱的adler32算法碰撞概率太高了,所以我們還要引入強的checksum算法以保證兩文件塊是相同的。也就是說,弱的checksum是用來區別不同,而強的是用來確認相同。(checksum的具體公式可能看這篇文章)
 
2)傳輸算法。同步目標端會把fileDst的一個checksum列表傳給同步源,這個列表里包括了三個東西,rolling checksum(32bits),md5 checksume(128bits),文件塊編號。
 
我估計你猜到了同步源機器拿到了這個列表后,會對fileSrc做同樣的checksum,然后和fileDst的checksum做對比,這樣就知道哪些文件塊改變了。
 
但是,聰明的你一定會有以下兩個疑問:
 
如果我fileSrc這邊在文件中間加了一個字符,這樣后面的文件塊都會位移一個字符,這樣就完全和fileDst這邊的不一樣了,但理論上來說,我應該只需要傳一個字符就好了。這個怎么解決?
如果這個checksum列表特別長,而我的兩邊的相同的文件塊可能并不是一樣的順序,那就需要查找,線性的查找起來應該特別慢吧。這個怎么解決?
很好,讓我們來看一下同步源端的算法。
3)checksum查找算法。同步源端拿到fileDst的checksum數組后,會把這個數據存到一個hash table中,用rolling checksum做hash,以便獲得O(1)時間復雜度的查找性能。這個hash table是16bits的,所以,hash table的尺寸是2的16次方,對rolling checksum的hash會被散列到0 – 2^16 – 1中的某個值。(對于hash table,如果你不清楚,請回去看你大學時的數據結構那本教科書)
 
順便說一下,我在網上看到很多文章說,“要對rolling checksum做排序”(比如這篇和這篇),這兩篇文章都引用并翻譯了原版的這篇文章,但是他們都理解錯了,不是排序,就只是把fileDst的checksum數據,按rolling checksum做存到2^16的hash table中,當然會發生碰撞,把碰撞的做成一個鏈接就好了。這就是原文中所說的第二步。
 
4)比對算法。這是最關鍵的算法,細節如下:
 
4.1)取fileSrc的第一個文件塊(我們假設的是512個長度),也就是從fileSrc的第1個字節到第512個字節,取出來后做rolling checksum計算。計算好的值到hash表中查。
 
4.2)如果查到了,說明發現在fileDst中有潛在相同的文件塊,于是就再比較md5的checksum,因為rolling checksume太弱了,可能發生碰撞。于是還要算md5的128bits的checksum,這樣一來,我們就有 2^-(32+128) = 2^-160的概率發生碰撞,這太小了可以忽略。如果rolling checksum和md5 checksum都相同,這說明在fileDst中有相同的塊,我們需要記下這一塊在fileDst下的文件編號。
 
4.3)如果fileSrc的rolling checksum 沒有在hash table中找到,那就不用算md5 checksum了。表示這一塊中有不同的信息。總之,只要rolling checksum 或 md5 checksum 其中有一個在fileDst的checksum hash表中找不到匹配項,那么就會觸發算法對fileSrc的rolling動作。于是,算法會住后step 1個字節,取fileSrc中字節2-513的文件塊要做checksum,go to (4.1) - 現在你明白什么叫rolling checksum了吧。
 
4.4)這樣,我們就可以找出fileSrc相鄰兩次匹配中的那些文本字符,這些就是我們要往同步目標端傳的文件內容了。
 
圖示
 
怎么,你沒看懂? 好吧,我送佛送上西,畫個示意圖給你看看(對圖中的東西我就不再解釋了)。
 
 
 
這樣,最終,在同步源這端,我們的rsync算法可能會得到下面這個樣子的一個數據數組,圖中,紅色塊表示在目標端已匹配上,不用傳輸(注:我專門在其中顯示了兩塊chunk #5,相信你會懂的),而白色的地方就是需要傳輸的內容(注意:這些白色的塊是不定長的),這樣,同步源這端把這個數組(白色的就是實際內容,紅色的就放一個標號)壓縮傳到目的端,在目的端的rsync會根據這個表重新生成文件,這樣,同步完成。
 
 
 
最后想說一下,對于某些壓縮文件使用rsync傳輸可能會傳得更多,因為被壓縮后的文件可能會非常的不同。對此,對于gzip和bzip2這樣的命令,記得開啟 “rsyncalbe” 模式。

【編輯推薦】

  1. Chkdsk大躍進:Win8磁盤檢測時間大大縮短
  2. Linux下使用mke2fsk格式化分區的方法
  3. Ubuntu 11.10 利用終端環境備份還原
責任編輯:趙寧寧
相關推薦

2018-08-19 11:00:05

2017-05-26 08:53:27

數據挖掘算法

2018-08-06 09:40:22

2022-06-06 12:53:17

吳恩達AI機器學習

2025-09-03 01:11:00

2019-04-30 09:00:08

人工智能AI開發者

2017-06-08 11:54:40

億級推廣流量

2020-09-03 10:17:05

TikTok

2017-06-16 15:16:32

2018-06-04 12:41:50

程序員貪心算法分析

2014-08-21 10:30:06

谷歌算法

2020-09-16 13:01:37

TikTok美國字節跳動

2023-07-03 08:01:54

2019-10-29 15:09:52

Python貪心算法代碼

2017-06-12 16:03:19

IT技術周刊

2020-04-22 11:19:07

貪心算法動態規劃

2014-08-21 10:21:21

谷歌核心算法

2021-10-18 07:51:39

回溯算法面試

2025-05-14 16:39:21

2020-05-11 15:13:34

谷歌算法更新
點贊
收藏

51CTO技術棧公眾號

亚洲高清在线观看一区| 香蕉久久国产| 在线日韩三级| 日韩高清中文字幕一区| 精品婷婷伊人一区三区三| 精品国产18久久久久久洗澡| 美女视频黄久久| 色综合久久久久久久久| 日韩av在线免费播放| 男人免费av| 99在线精品视频| 亚洲中文字幕无码一区二区三区| 一区二区激情| 久久精品视频在线| 成人看片网页| 午夜精品在线视频| 欧美日韩激情| 日韩视频免费大全中文字幕| 国产1区在线| 国产精品无遮挡| 26uuu国产精品视频| 亚洲午夜高清视频| 国产色噜噜噜91在线精品| 日韩片之四级片| 成人小视频在线看| 久久国产人妖系列| 色哟哟免费网站| 在线成人小视频| 筱崎爱全乳无删减在线观看| 欧美一级大胆视频| 精品一区二区三区免费视频| 四色成人av永久网址| 亚洲欧美日韩视频一区| 国产精品97| 天天操天天爽天天射| 欧美激情精品久久久久久黑人| 亚洲+变态+欧美+另类+精品| yellow视频在线观看一区二区 | 九色视频一区| www.久久久久久久久| 国产手机视频在线观看| 日韩精品免费专区| 国产成年人在线观看| 国产精品国产三级国产| 国产三级视频| 国产视频亚洲精品| 精品福利樱桃av导航| 精品国产网站| 浮妇高潮喷白浆视频| 欧美日韩一二区| 啪啪国产精品| 五月天在线免费视频| 欧美一区二区三区在线看| 国产日韩中文在线中文字幕| 成人天堂噜噜噜| 国产精品久久久久久久久免费丝袜 | 欧洲亚洲一区二区三区| 国产中文字幕91| 日韩久久一区二区| 四虎影院在线域名免费观看| 欧美日韩国产高清一区二区三区| 天堂а√在线8种子蜜桃视频| 成人午夜视频在线| 欧美激情图区| 91精品久久久久久蜜桃| 亚洲人a成www在线影院| 97热精品视频官网| 亚洲精品美女| 九九99九九精彩| 亚洲精品在线看| 裸体素人女欧美日韩| 男女视频在线观看免费| 国产成人精品一区二区| 亚洲国产电影在线观看| 成人在线高清| 亚洲在线色站| 欧美日韩另类国产亚洲欧美一级| 青青草这里只有精品| 黄色一级大片在线观看| 欧美精品国产一区| 久久九九国产视频| 永久555www成人免费| 国产在线观看一区二区| 国产精品一品| 日韩在线第一区| 欧美日韩不卡视频| 激情欧美丁香| 亚洲成人影院少妇| 国产精品igao视频| ...av二区三区久久精品| 麻豆久久一区| 国语对白做受xxxxx在线中国| 伊人伊人伊人久久| 国产成人综合亚洲91猫咪| free性欧美| 久久免费视频2| 亚洲丝袜av一区| 国产v综合v亚洲欧| 日本在线一区二区| 中文字幕欧美人妻精品一区| 麻豆一区二区在线观看| 国产日韩精品一区二区三区在线| 精品一区二区三区四区五区 | 日韩精品中文字幕在线不卡尤物| 激情成人综合| 国产丝袜在线观看视频| 亚洲精品在线观看免费| 日韩高清a**址| 国产高清精品久久久久| 经典三级一区二区| 日韩精品一区中文字幕| 97久久伊人激情网| 国产精品久久久久四虎| 中文字幕一区二区三区精华液 | 亚洲精品伦理在线| 中文字幕av一区二区三区佐山爱| 欧美日韩另类国产亚洲欧美一级| 女生裸体视频一区二区三区| 日本福利片在线| 久久国产精品久久精品国产| 欧美刺激脚交jootjob| 国产精品综合在线视频| 国产66精品久久久久999小说| 911国产精品| 激情深爱一区二区| 日韩最新av| 亚洲kkk444kkk在线观看| 免费在线国产精品| 中国人与牲禽动交精品| 中文字幕一区av| 五月激情综合| 四虎亚洲精品| 日本免费观看网站| 亚洲www视频| 精品亚洲男同gayvideo网站| 国产日韩欧美麻豆| 狠狠综合久久| 欧美大片1688网站| 午夜爽爽视频| 亚洲亚洲精品三区日韩精品在线视频 | 九九久久久久99精品| 午夜在线成人av| 免费人成精品欧美精品| 日韩免费成人| 麻豆传媒在线完整视频| 六月丁香婷婷在线| 国产乱码精品一区二区三区不卡| 中文字幕日韩在线观看| 岛国视频午夜一区免费在线观看| 奇米精品一区二区三区四区| 精品三级av| 国产盗摄一区二区| 免费av片在线观看一道本| 色播五月综合| 国产精品扒开腿做爽爽爽男男| 欧美日本高清视频在线观看| 国内久久视频| 亚洲国产精品ⅴa在线观看| 成人午夜免费av| av中文字幕亚洲| 亚洲第一精品夜夜躁人人爽| 国产一区二区三区黄视频 | 91网站在线观看免费| 爽爽免费视频| 黄色精品视频| 一区二区三区不卡在线| 97国产精品视频人人做人人爱| 欧美图区在线视频| 欧美精彩视频一区二区三区| 久久精品导航| 日韩高清欧美| 国产情侣一区在线| 日韩毛片久久久| 午夜黄色一级片| 激情伊人五月天| 久久久综合香蕉尹人综合网| 九色成人免费视频| 色综合色综合色综合色综合| 国产黄色网页| 女子免费在线观看视频www| 亚洲精品大片| 噜噜噜在线观看免费视频日韩 | 九色91在线| 1204国产成人精品视频| 91精品国产麻豆国产在线观看| 免费成人美女在线观看| 日韩欧美激情四射| 国产精品一区二区久久国产| 亚洲欧美综合一区| 一区在线观看视频| 久久99精品国产麻豆婷婷| 99久久国产综合精品成人影院| 国产一区一区| 欧美人与禽性xxxxx杂性| 一不卡在线视频| 日本在线视频www| 黄色成人在线免费观看| 欧美激情一区二区三区在线视频 | 日韩欧美视频在线播放| 国产在线不卡一区二区三区|