国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

Go:不用標準庫如何解壓 Zip 文件?

開發 后端
我們來看看這里[1]定義的 zip 結構 。根據第 4.3.6 節,看起來文件元數據后跟文件內容一個接一個地存儲,最后一塊是 “central directory” 元數據。

[[439858]]

大家好,我是程序員幽鬼。

zip 是一種常見的歸檔格式,本文講解 Go 如何操作 zip。

首先看看 zip 文件是如何工作的。以一個小文件為例:(類 Unix 系統下)

  1. $ cat hello.text 
  2.  
  3. Hello! 

執行 zip 命令進行歸檔:

  1. $ zip test.zip hello.text 
  2.  
  3. adding: hello.text (stored 0%) 
  4.  
  5. $ ls -lah test.zip 
  6.  
  7. -rw-r--r-- 1 phil phil 177 Nov 23 23:04 test.zip 

一個 6 字節的文本文件變成了一個 177 字節的 zip 文件。這并不大,解析 177 個字節聽起來不可能太復雜!

對 zip 文件執行 hexdump:

  1. $ hexdump -C test.zip 
  2. 00000000  50 4b 03 04 0a 00 00 00  00 00 8a b8 77 53 9e d8  |PK..........wS..| 
  3. 00000010  42 b0 07 00 00 00 07 00  00 00 0a 00 1c 00 68 65  |B.............he| 
  4. 00000020  6c 6c 6f 2e 74 65 78 74  55 54 09 00 03 74 73 9d  |llo.textUT...ts.| 
  5. 00000030  61 74 73 9d 61 75 78 0b  00 01 04 eb 03 00 00 04  |ats.aux.........| 
  6. 00000040  eb 03 00 00 48 65 6c 6c  6f 21 0a 50 4b 01 02 1e  |....Hello!.PK...| 
  7. 00000050  03 0a 00 00 00 00 00 8a  b8 77 53 9e d8 42 b0 07  |.........wS..B..| 
  8. 00000060  00 00 00 07 00 00 00 0a  00 18 00 00 00 00 00 01  |................| 
  9. 00000070  00 00 00 a4 81 00 00 00  00 68 65 6c 6c 6f 2e 74  |.........hello.t| 
  10. 00000080  65 78 74 55 54 05 00 03  74 73 9d 61 75 78 0b 00  |extUT...ts.aux..| 
  11. 00000090  01 04 eb 03 00 00 04 eb  03 00 00 50 4b 05 06 00  |...........PK...| 
  12. 000000a0  00 00 00 01 00 01 00 50  00 00 00 4b 00 00 00 00  |.......P...K....| 
  13. 000000b0  00                                                |.| 
  14. 000000b1 

從中我們可以看到文件名和文件內容。

01 結構

我們來看看這里[1]定義的 zip 結構 。根據第 4.3.6 節,看起來文件元數據后跟文件內容一個接一個地存儲,最后一塊是 “central directory” 元數據。

zip format header

圖片來源:https://www.codeproject.com/Articles/8688/Extracting-files-from-a-remote-ZIP-archive

本地 header 元數據如下所示:

字段 大小
local file header signature 4 bytes
version needed to extract 2 bytes
general purpose bit flag 2 bytes
compression method 2 bytes
last mod file time 2 bytes
last mod file date 2 bytes
crc-32 4 bytes
compressed size 4 bytes
uncompressed size 4 bytes
file name length 2 bytes
extra field length 2 bytes
file name 可變
extra field 可變

在一個有效 zip 文件中,header 簽名是一個整數 (0x04034b50 )。我們將忽略版本、通用 flag 和校驗和。可以是沒有壓縮(用 0 表示),也可以是使用 DEFLATE 方法解壓縮(用 8 表示)。

最后修改時間和日期是 MSDOS 風格的日期/時間格式。

我們粗略地將其翻譯為 Go 代碼:

  1. package main 
  2.  
  3. import ( 
  4.     "os" 
  5.     "bytes" 
  6.     "compress/flate" 
  7.     "io/ioutil" 
  8.     "encoding/binary" 
  9.     "time" 
  10.     "fmt" 
  11.  
  12. type compression uint8 
  13. const ( 
  14.     noCompression compression = iota 
  15.     deflateCompression 
  16.  
  17. type localFileHeader struct { 
  18.     signature uint32 
  19.     version uint16 
  20.     bitFlag uint16 
  21.     compression compression 
  22.     lastModified time.Time 
  23.     crc32 uint32 
  24.     compressedSize uint32 
  25.     uncompressedSize uint32 
  26.     fileName string 
  27.     extraField []byte 
  28.     fileContents string 

02 main 函數實現

我們的入口點將讀取一個 zip 文件并遍歷該文件,直到我們無法解析 zip 文件條目。

  1. func main() { 
  2.     f, err := ioutil.ReadFile(os.Args[1]) 
  3.     if err != nil { 
  4.         panic(err) 
  5.     } 
  6.  
  7.     end := 0 
  8.     for end < len(f) { 
  9.         var err error 
  10.         var lfh *localFileHeader 
  11.         var next int 
  12.         lfh, next, err = parseLocalFileHeader(f, end
  13.         if err == errNotZip && end > 0 { 
  14.             break 
  15.         } 
  16.         if err != nil { 
  17.             panic(err) 
  18.         } 
  19.  
  20.         end = next 
  21.  
  22.         fmt.Println(lfh.lastModified, lfh.fileName, lfh.fileContents) 
  23.     } 

03 文件

對于每個文件,如果前四個字節不是魔術 zip 簽名(即 0x04034b50),則報錯。

  1. var errNotZip = fmt.Errorf("Not a zip file"
  2.  
  3. func parseLocalFileHeader(bs []byte, start int) (*localFileHeader, int, error) { 
  4.     signature, i, err := readUint32(bs, start) 
  5.     if signature != 0x04034b50 { 
  6.         return nil, 0, errNotZip 
  7.     } 
  8.     if err != nil { 
  9.         return nil, 0, err 
  10.     } 

基本模式是讀取輔助函數將獲取一個偏移量并返回一個 Go 值和一個新的偏移量。讀取輔助函數將進行邊界檢查。

遵循相同的模式直到結構體的末尾:

  1. version, i, err := readUint16(bs, i) 
  2. if err != nil { 
  3.     return nil, 0, err 
  4.  
  5. bitFlag, i, err := readUint16(bs, i) 
  6. if err != nil { 
  7.     return nil, 0, err 
  8.  
  9. compression := noCompression 
  10. compressionRaw, i, err := readUint16(bs, i) 
  11. if err != nil { 
  12.     return nil, 0, err 
  13. if compressionRaw == 8 { 
  14.     compression = deflateCompression 
  15.  
  16. lmTime, i, err := readUint16(bs, i) 
  17. if err != nil { 
  18.     return nil, 0, err 
  19.  
  20. lmDate, i, err := readUint16(bs, i) 
  21. if err != nil { 
  22.     return nil, 0, err 
  23. lastModified := msdosTimeToGoTime(lmDate, lmTime) 
  24.  
  25. crc32, i, err := readUint32(bs, i) 
  26. if err != nil { 
  27.     return nil, 0, err 
  28.  
  29. compressedSize, i, err := readUint32(bs, i) 
  30. if err != nil { 
  31.     return nil, 0, err 
  32.  
  33. uncompressedSize, i, err := readUint32(bs, i) 
  34. if err != nil { 
  35.     return nil, 0, err 
  36.  
  37. fileNameLength, i, err := readUint16(bs, i) 
  38. if err != nil { 
  39.     return nil, 0, err 
  40.  
  41. extraFieldLength, i, err := readUint16(bs, i) 
  42. if err != nil { 
  43.     return nil, 0, err 
  44.  
  45. fileName, i, err := readString(bs, i, int(fileNameLength)) 
  46. if err != nil { 
  47.     return nil, 0, err 
  48.  
  49. extraField, i, err := readBytes(bs, i, int(extraFieldLength)) 
  50. if err != nil { 
  51.     return nil, 0, err 

現在,如果文件內容未壓縮,我們只需復制文件頭后的字節即可。如果文件內容被壓縮,我們將使用 Go 的內置 DEFLATE 支持來解壓縮文件頭之后的字節。

  1. var fileContents string 
  2. if compression == noCompression { 
  3.     fileContents, i, err = readString(bs, i, int(uncompressedSize)) 
  4.     if err != nil { 
  5.         return nil, 0, err 
  6.     } 
  7. else { 
  8.     end := i + int(compressedSize) 
  9.     if end > len(bs) { 
  10.         return nil, 0, errOverranBuffer 
  11.     } 
  12.     flateReader := flate.NewReader(bytes.NewReader(bs[i:end])) 
  13.  
  14.     defer flateReader.Close() 
  15.     read, err := ioutil.ReadAll(flateReader) 
  16.     if err != nil { 
  17.         return nil, 0, err 
  18.     } 
  19.  
  20.     fileContents = string(read
  21.  
  22.     i = end 

并返回填充好的結構體實例:

  1. return &localFileHeader{ 
  2.     signature: signature, 
  3.     version: version, 
  4.     bitFlag: bitFlag, 
  5.     compression: compression, 
  6.     lastModified: lastModified, 
  7.     crc32: crc32, 
  8.     compressedSize: compressedSize, 
  9.     uncompressedSize: uncompressedSize, 
  10.     fileName: fileName, 
  11.     extraField: extraField, 
  12.     fileContents: fileContents, 
  13. }, i, nil 

04 讀取輔助函數

現在我們只定義那些帶有邊界檢查的讀取輔助函數,使用 Go 的內置庫來處理二進制編碼。

  1. var errOverranBuffer = fmt.Errorf("Overran buffer"
  2.  
  3. func readUint32(bs []byte, offset int) (uint32, int, error) { 
  4.     end := offset + 4 
  5.     if end > len(bs) { 
  6.         return 0, 0, errOverranBuffer 
  7.     } 
  8.  
  9.     return binary.LittleEndian.Uint32(bs[offset:end]), end, nil 
  10.  
  11. func readUint16(bs []byte, offset int) (uint16, int, error) { 
  12.     end := offset+2 
  13.     if end > len(bs) { 
  14.         return 0, 0, errOverranBuffer 
  15.     } 
  16.  
  17.     return binary.LittleEndian.Uint16(bs[offset:end]), end, nil 

并且基本上只對獲取的字節和字符串進行邊界檢查。

  1. func readBytes(bs []byte, offset int, n int) ([]byte, int, error) { 
  2.     end := offset + n 
  3.     if end > len(bs) { 
  4.         return nil, 0, errOverranBuffer 
  5.     } 
  6.  
  7.     return bs[offset:offset+n], end, nil 
  8.  
  9. func readString(bs []byte, offset int, n int) (string, int, error) { 
  10.     readend, err := readBytes(bs, offset, n) 
  11.     return string(read), end, err 

05 MSDOS 時間

我猜在創建 zip 時,MSDOS 時間格式很流行。但它在今天并不流行,所以花了一些時間才最終用一些代碼(模仿 C 語言)找到對該格式的解釋[2]。

  1. func msdosTimeToGoTime(d uint16, t uint16) time.Time { 
  2.     seconds := int((t & 0x1F) * 2) 
  3.     minutes := int((t >> 5) & 0x3F) 
  4.     hours := int(t >> 11) 
  5.  
  6.     day := int(d & 0x1F) 
  7.     month := time.Month((d >> 5) & 0x0F) 
  8.     year := int((d >> 9) & 0x7F) + 1980 
  9.     return time.Date(yearmonthday, hours, minutes, seconds, 0, time.Local

06 測試

運行:

  1. $ go build 
  2. $ ./gozip test.zip 
  3. 2021-11-23 23:04:20 +0000 UTC hello.text Hello! 

這看起來不錯!現在讓我們嘗試壓縮多個文件。

  1. $ cat bye.text 
  2. Au revoir! 
  3. $ rm test.zip 
  4. $ zip test.zip *.text 
  5.   adding: bye.text (stored 0%) 
  6.   adding: hello.text (stored 0%) 
  7. $ ./gozip test.zip 
  8. 2021-11-24 03:40:00 +0000 UTC bye.text Au revoir! 
  9.  
  10. 2021-11-23 23:04:20 +0000 UTC hello.text Hello! 

一切正常。

07 總結

實際上,還有許多標準需要處理(例如目錄)和許多常見的擴展,本文沒有涉及。

文件末尾還有一些空間,這可能是 “central directory” 元數據,但我還沒有深入研究。如果你有興趣可以查閱相關資料了解最后剩下的部分內容。

原文鏈接:https://notes.eatonphil.com/implementing-zip-in-go-unzipping.html

參考資料

[1]這里: https://pkware.cachefly.net/webdocs/casestudies/APPNOTE.TXT

[2]對該格式的解釋: https://groups.google.com/g/comp.os.msdos.programmer/c/ffAVUFN2NbA

 

責任編輯:武曉燕 來源: 幽鬼
相關推薦

2021-05-08 00:00:27

JavaScript ZIP文件

2019-10-17 17:15:01

Linux解壓文件命令

2015-04-08 15:40:53

php在線解壓解壓zip文件

2018-02-28 13:20:40

Python解壓zip

2023-04-02 23:13:07

Go語言bufio

2011-08-15 14:07:53

Objective-C解壓縮ZIP文件

2021-08-13 12:05:15

Goneturl

2023-03-29 08:59:59

Go壓縮包文檔

2024-02-22 12:16:55

Python壓縮數據

2020-09-09 14:30:24

2024-09-29 16:04:14

2012-05-10 09:43:28

2023-09-27 08:26:48

Go標準庫函數

2020-12-13 17:57:16

加密密碼Python

2021-08-10 21:58:54

Go語言Flag庫

2023-10-11 08:45:55

Go標準庫指標

2025-10-31 09:01:37

2011-12-30 11:14:41

Javazip

2020-12-21 16:00:07

Pythonzip文件密碼

2021-10-18 10:53:26

Go 代碼技術
點贊
收藏

51CTO技術棧公眾號

丰满岳乱妇一区二区三区| 欧美性xxxx极品高清hd直播| 97在线观看免费| 91老司机福利在线| 色香蕉久久蜜桃| 黄网站色大毛片| 中文字幕乱码亚洲精品一区| 免费看一级大黄情大片| 久久成人免费网| 午夜精品电影在线观看| 免费中文字幕日韩欧美| 精品国产乱码久久久久| 91精品久久久久久久久久不卡| 欧洲一区二区视频| 欧美日韩导航| 国产91精品高潮白浆喷水| 久久99精品国产自在现线| 高清欧美一区二区三区| 国产乱论精品| 国产精品久久一| 99精品全国免费观看视频软件| 国产精品成人v| 成人91在线| 91精品久久久久久久久| 午夜精品国产| 国产一区二区三区奇米久涩| 亚洲精品日本| 日本三级中国三级99人妇网站| 亚洲欧美日韩专区| 日韩欧美视频一区二区| 蜜桃av一区二区在线观看 | 国产.欧美.日韩| 好吊色视频988gao在线观看| 蜜桃久久精品一区二区| 国产欧美综合一区| 久久综合五月天婷婷伊人| 色综合手机在线| 亚洲va欧美va人人爽午夜| 丁香婷婷在线观看| 亚洲激情自拍图| 国产精品麻豆| 日韩免费高清在线观看| 女主播福利一区| 视频一区二区在线观看| 成人性生交大片免费看中文| 性生活免费在线观看| 精品人伦一区二区三区蜜桃免费 | 777午夜精品电影免费看| 欧美精品一二区| 日韩在线综合| 午夜精品美女久久久久av福利| 成人免费观看av| 国产在线视频你懂| 欧美一区二区三区四区久久| 美女视频一区| 国产综合福利在线| 久久国产日韩欧美精品| 手机视频在线观看| 91国偷自产一区二区三区观看 | 精品福利一区二区| 污污在线观看| 久久久久久噜噜噜久久久精品| 久久中文字幕二区| 亚洲午夜激情| 成人免费一区二区三区在线观看| 川上优的av在线一区二区| 中文字幕精品av| 99国产**精品****| 一本一生久久a久久精品综合蜜 | xxxx18hd亚洲hd捆绑| 亚洲国产综合人成综合网站| 国产精品实拍| 久久全球大尺度高清视频| 影音先锋中文字幕一区| 成人午夜精品久久久久久久蜜臀| 精品欧美一区二区三区| 性感美女一区二区在线观看| 国产精品综合网站| 国产成人综合网站| 久久免费看视频| 日韩中文字幕在线视频| 欧美.日韩.国产.一区.二区| 国产中文字幕免费观看| 91麻豆精品国产91久久久久久| 国产一区二区三区不卡av| 亚洲高清资源综合久久精品| 亚洲国产日韩一级| 国产精品视频一区二区三区| 欧美成人一区二区在线| 一区二区三区免费| 日韩电影精品| 久久综合毛片| 亚洲国产精品久久久久秋霞影院| 成人看片网页| 免费看成人片| 欧美日韩视频在线| 亚洲一区二区三区在线免费| 日韩精品不卡| 狠狠久久亚洲欧美专区| 一区二区三区四区视频免费观看 | 欧美激情偷拍自拍| 成人毛片一区二区| 精品久久久久久无| 伊人久久大香线| 国产不卡视频| 裸体女人亚洲精品一区| 精品亚洲国产成人av制服丝袜| 午夜视频在线观看韩国| 777777777亚洲妇女| 99精品一区二区| 神马午夜在线视频| 日本成人黄色免费看| 91成人在线免费观看| 成人在线电影在线观看视频| 97视频在线| 欧美国产视频一区二区| 9l国产精品久久久久麻豆| 亚洲美女炮图| 一区国产精品| 亚洲级视频在线观看免费1级| 在线综合欧美| 日本成人网址| 国产欧美一区二区视频| 精品久久香蕉国产线看观看亚洲| 免费精品国产| 日本中文字幕视频| 日韩av电影院| 亚洲精品乱码久久久久久黑人| 97久久综合区小说区图片区| 免费成人在线视频网站| 在线观看欧美www| 成人自拍视频在线观看| 国产一线二线在线观看| 日韩偷拍一区二区| 亚洲精品97久久| 国产曰批免费观看久久久| 精精国产xxxx视频在线播放| 爱爱爱视频网站| 国产亚洲精品久久久久久牛牛| 国产精品香蕉一区二区三区| 超碰这里只有精品| 色婷婷综合久久久久中文字幕 | 超碰97免费在线| 亚洲一区3d动漫同人无遮挡 | 国产精品99| 阿v天堂2017| 久久久久久久久久久人体| 17c精品麻豆一区二区免费| 九九久久精品| 六十路在线观看| 日韩精品欧美专区| 亚洲免费精彩视频| www.久久久久久久久| 都市激情亚洲| 在线色视频网| 麻豆传媒一区二区| 亚洲另类xxxx| 国产女人aaa级久久久级 | 九色成人免费视频| 一区二区三区日韩精品| 亚洲国产精品日韩专区av有中文| 国产区视频在线| 亚洲一二区在线| 久久精品国产亚洲| 亚洲国产日韩在线一区模特| 亚洲影视在线| 国产精品高清一区二区| 992tv在线影院| 欧洲视频一区二区三区| 色婷婷久久av| 亚洲国产成人av网| 葵司免费一区二区三区四区五区| 男人久久天堂| 男人插曲女人视频免费| 国产高清自拍一区| 亚洲天堂网在线观看| 亚洲视频1区2区| 免费视频一区二区三区在线观看| 午夜av成人| 在线视频你懂| 在线观看成人免费| 国产91色在线| 亚洲精品久久在线| 亚洲精品中文在线观看| 日韩成人精品在线观看| 欧洲vs亚洲vs国产| 欧美卡一卡二| 欧美18—20岁hd第一次| 久久综合久久久| 欧美精品在线免费播放| 色诱视频网站一区| 成人国产亚洲欧美成人综合网| 欧美性感美女一区二区| 黄视频网站在线观看| 天天射综合网站| 国产在线播放观看| 国产一区二区三区奇米久涩 | 欧美一级大黄| 欧美日韩国产综合视频| 97国产在线播放|