国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

為你的 awk 腳本注入 Groovy

開發(fā) 后端
awk 和 Groovy 相輔相成,可以創(chuàng)建強(qiáng)大、有用的腳本。

最近我寫了一個(gè)使用 Groovy 腳本來清理我的音樂文件中的標(biāo)簽的系列。我開發(fā)了一個(gè) ??框架??,可以識(shí)別我的音樂目錄的結(jié)構(gòu),并使用它來遍歷音樂文件。在該系列的最后一篇文章中,我從框架中分離出一個(gè)實(shí)用類,我的腳本可以用它來處理文件。

這個(gè)獨(dú)立的框架讓我想起了很多 awk 的工作方式。對(duì)于那些不熟悉 awk 的人來說,你學(xué)習(xí)下這本電子書:

??《awk 實(shí)用指南》??

我從 1984 年開始大量使用 awk,當(dāng)時(shí)我們的小公司買了第一臺(tái)“真正的”計(jì)算機(jī),它運(yùn)行的是 System V Unix。對(duì)我來說,awk 是非常完美的:它有關(guān)聯(lián)內(nèi)存associative memory——將數(shù)組視為由字符串而不是數(shù)字來索引的。它內(nèi)置了正則表達(dá)式,似乎專為處理數(shù)據(jù)而生,尤其是在處理數(shù)據(jù)列時(shí),而且結(jié)構(gòu)緊湊,易于學(xué)習(xí)。最后,它非常適合在 Unix 工作流使用,從標(biāo)準(zhǔn)輸入或文件中讀取數(shù)據(jù)并寫入到輸出,數(shù)據(jù)不需要經(jīng)過其他的轉(zhuǎn)換就出現(xiàn)在了輸入流中。

說 awk 是我日常計(jì)算工具箱中的一個(gè)重要部分一點(diǎn)也不為過。然而,在我使用 awk 的過程中,有幾件事讓我感到不滿意。

可能主要的問題是 awk 善于處理以分隔字段呈現(xiàn)的數(shù)據(jù),但很奇怪它不善于處理 CSV 文件,因?yàn)?CSV 文件的字段被引號(hào)包圍時(shí)可以嵌入逗號(hào)分隔符。另外,自 awk 發(fā)明以來,正則表達(dá)式已經(jīng)有了很大的發(fā)展,我們需要記住兩套正則表達(dá)式的語法規(guī)則,而這并不利于編寫無 bug 的代碼。??一套這樣的規(guī)則已經(jīng)很糟糕了??。

由于 awk 是一門簡(jiǎn)潔的語言,因此它缺少很多我認(rèn)為有用的東西,比如更豐富的基礎(chǔ)類型、結(jié)構(gòu)體、??switch?? 語句等等。

相比之下,Groovy 擁有這些能力:可以使用 ??OpenCSV 庫???,它很擅長(zhǎng)處理 CSV 文件、Java 正則表達(dá)式和強(qiáng)大的匹配運(yùn)算符、豐富的基礎(chǔ)類型、類、??switch?? 語句等等。

Groovy 所缺乏的是簡(jiǎn)單的面向管道的概念,即把要處理數(shù)據(jù)作為一個(gè)傳入的流,以及把處理過的數(shù)據(jù)作為一個(gè)傳出的流。

但我的音樂目錄處理框架讓我想到,也許我可以創(chuàng)建一個(gè) Groovy 版本的 awk “引擎”。這就是我寫這篇文章的目的。

安裝 Java 和 Groovy

Groovy 是基于 Java 的,需要先安裝 Java。最新的、合適的 Java 和 Groovy 版本可能都在你的 Linux 發(fā)行版的軟件庫中。Groovy 也可以按照 ??Groovy 主頁??? 上的說明進(jìn)行安裝。對(duì)于 Linux 用戶來說,一個(gè)不錯(cuò)的選擇是 ??SDKMan??,它可以用來獲得多個(gè)版本的 Java、Groovy 和其他許多相關(guān)工具。在這篇文章中,我使用的是 SDK 的版本:

  • Java:OpenJDK 11 的 11.0.12 的開源版本
  • Groovy:3.0.8

使用 Groovy 創(chuàng)建 awk

這里的基本想法是將打開一個(gè)或多個(gè)文件進(jìn)行處理、將每行分割成字段、以及提供對(duì)數(shù)據(jù)流的訪問等復(fù)雜情況封裝在三個(gè)部分:

  • 在處理數(shù)據(jù)之前
  • 在處理每行數(shù)據(jù)時(shí)
  • 在處理完所有數(shù)據(jù)之后

我并不打算用 Groovy 來取代 awk。相反,我只是在努力實(shí)現(xiàn)我的典型用例,那就是:

  • 使用一個(gè)腳本文件而不是在命令行寫代碼
  • 處理一個(gè)或多個(gè)輸入文件
  • 設(shè)置默認(rèn)的分隔符為??|??,并基于這個(gè)分隔符分割所有行
  • 使用 OpenCSV 完成分割工作(awk 做不到)

框架類

下面是用 Groovy 類實(shí)現(xiàn)的 “awk 引擎”:

@Grab('com.opencsv:opencsv:5.6')
import com.opencsv.CSVReader
public class AwkEngine {
// With admiration and respect for
// Alfred Aho
// Peter Weinberger
// Brian Kernighan
// Thank you for the enormous value
// brought my job by the awk
// programming language
Closure onBegin
Closure onEachLine
Closure onEnd
private String fieldSeparator
private boolean isFirstLineHeader
private ArrayList<String> fileNameList
public AwkEngine(args) {
this.fileNameList = args
this.fieldSeparator = "|"
this.isFirstLineHeader = false
}
public AwkEngine(args, fieldSeparator) {
this.fileNameList = args
this.fieldSeparator = fieldSeparator
this.isFirstLineHeader = false
}
public AwkEngine(args, fieldSeparator, isFirstLineHeader) {
this.fileNameList = args
this.fieldSeparator = fieldSeparator
this.isFirstLineHeader = isFirstLineHeader
}
public void go() {
this.onBegin()
int recordNumber = 0
fileNameList.each { fileName ->
int fileRecordNumber = 0
new File(fileName).withReader { reader ->
def csvReader = new CSVReader(reader,
this.fieldSeparator.charAt(0))
if (isFirstLineHeader) {
def csvFieldNames = csvReader.readNext() as
ArrayList<String>
csvReader.each { fieldsByNumber ->
def fieldsByName = csvFieldNames.
withIndex().
collectEntries { name, index ->
[name, fieldsByNumber[index]]
}
this.onEachLine(fieldsByName,
recordNumber, fileName,
fileRecordNumber)
recordNumber++
fileRecordNumber++
}
} else {
csvReader.each { fieldsByNumber ->
this.onEachLine(fieldsByNumber,
recordNumber, fileName,
fileRecordNumber)
recordNumber++
fileRecordNumber++
}
}
}
}
this.onEnd()
}
}

雖然這看起來是相當(dāng)多的代碼,但許多行是因?yàn)樘L(zhǎng)換行了(例如,通常你會(huì)合并第 38 行和第 39 行,第 41 行和第 42 行,等等)。讓我們逐行看一下。

第 1 行使用 ??@Grab??? 注解從 ??Maven Central?? 獲取 OpenCSV 庫的 5.6 本周。不需要 XML。

第 2 行我引入了 OpenCSV 的 ??CSVReader?? 類

第 3 行,像 Java 一樣,我聲明了一個(gè) ??public??? 實(shí)用類 ??AwkEngine??。

第 11-13 行定義了腳本所使用的 Groovy 閉包實(shí)例,作為該類的鉤子。像任何 Groovy 類一樣,它們“默認(rèn)是 ??public???”,但 Groovy 將這些字段創(chuàng)建為 ??private??,并對(duì)其進(jìn)行外部引用(使用 Groovy 提供的 getter 和 setter 方法)。我將在下面的示例腳本中進(jìn)一步解釋這個(gè)問題。

第 14-16 行聲明了 ??private?? 字段 —— 字段分隔符,一個(gè)指示文件第一行是否為標(biāo)題的標(biāo)志,以及一個(gè)文件名的列表。

第 17-31 行定義了三個(gè)構(gòu)造函數(shù)。第一個(gè)接收命令行參數(shù)。第二個(gè)接收字段的分隔符。第三個(gè)接收指示第一行是否為標(biāo)題的標(biāo)志。

第 31-67 行定義了引擎本身,即 ??go()?? 方法。

第 33 行調(diào)用了 ??onBegin()??? 閉包(等同于 awk 的 ??BEGIN {}?? 語句)。

第 34 行初始化流的 ??recordNumber???(等同于 awk 的 ??NR?? 變量)為 0(注意我這里是從 00 而不是 1 開始的)。

第 35-65 行使用 ??each??? ??{}?? 來循環(huán)處理列表中的文件。

第 36 行初始化文件的 ??fileRecordNumber???(等同于 awk 的 ??FNR?? 變量)為 0(從 0 而不是 1 開始)。

第 37-64 行獲取一個(gè)文件對(duì)應(yīng)的 ??Reader?? 實(shí)例并處理它。

第 38-39 行獲取一個(gè) ??CSVReader?? 實(shí)例。

第 40 行檢測(cè)第一行是否為標(biāo)題。

如果第一行是標(biāo)題,那么在 41-42 行會(huì)從第一行獲取字段的標(biāo)題名字列表。

第 43-54 行處理其他的行。

第 44-48 行把字段的值復(fù)制到 ??name:value?? 的映射中。

第 49-51 行調(diào)用 ??onEachLine()??? 閉包(等同于 awk 程序 ??BEGIN {}??? 和 ??END {}??? 之間的部分,不同的是,這里不能輸入執(zhí)行條件),傳入的參數(shù)是 ??name:value?? 映射、處理過的總行數(shù)、文件名和該文件處理過的行數(shù)。

第 52-53 行是處理過的總行數(shù)和該文件處理過的行數(shù)的自增。

如果第一行不是標(biāo)題:

第 56-62 行處理每一行。

第 57-59 調(diào)用 ??onEachLine()?? 閉包,傳入的參數(shù)是字段值的數(shù)組、處理過的總行數(shù)、文件名和該文件處理過的行數(shù)。

第 60-61 行是處理過的總行數(shù)和該文件處理過的行數(shù)的自增。

第 66 行調(diào)用 ??onEnd()??? 閉包(等同于 awk 的 ??END {}??)。

這就是該框架的內(nèi)容。現(xiàn)在你可以編譯它:

$ groovyc AwkEngine.groovy

一點(diǎn)注釋:

如果傳入的參數(shù)不是一個(gè)文件,編譯就會(huì)失敗,并出現(xiàn)標(biāo)準(zhǔn)的 Groovy 堆棧跟蹤,看起來像這樣:

Caught: java.io.FileNotFoundException: not-a-file (No such file or directory)
java.io.FileNotFoundException: not-a-file (No such file or directory)
at AwkEngine$_go_closure1.doCall(AwkEngine.groovy:46)

OpenCSV 可能會(huì)返回 ??String[]??? 值,不像 Groovy 中的 ??List??? 值那樣方便(例如,數(shù)組沒有 ??each {}???)。第 41-42 行將標(biāo)題字段值數(shù)組轉(zhuǎn)換為 list,因此第 57 行的 ??fieldsByNumber?? 可能也應(yīng)該轉(zhuǎn)換為 list。

在腳本中使用這個(gè)框架

下面是一個(gè)使用 ??AwkEngine??? 來處理 ??/etc/group?? 之類由冒號(hào)分隔并沒有標(biāo)題的文件的簡(jiǎn)單腳本:

def ae = new AwkEngine(args, ':')
int lineCount = 0
ae.onBegin = {
println “in begin”
}
ae.onEachLine = { fields, recordNumber, fileName, fileRecordNumber ->
if (lineCount < 10)
println “fileName $fileName fields $fields”
lineCount++
}
ae.onEnd = {
println “in end”
println “$lineCount line(s) read”
}
ae.go()

第 1 行 調(diào)用的有兩個(gè)參數(shù)的構(gòu)造函數(shù),傳入了參數(shù)列表,并定義冒號(hào)為分隔符。

第 2 行定義一個(gè)腳本級(jí)的變量 ??lineCount???,用來記錄處理過的行數(shù)(注意,Groovy 閉包不要求定義在外部的變量為 ??final??)。

第 3-5 行定義 ??onBegin()?? 閉包,在標(biāo)準(zhǔn)輸出中打印出 “in begin” 字符串。

第 6-10 行定義 ??onEachLine()??? 閉包,打印文件名和前 10 行字段,無論是否為前 10 行,處理過的總行數(shù) ??lineCount?? 都會(huì)自增。

第 11-14 行定義 ??onEnd()?? 閉包,打印 “in end” 字符串和處理過的總行數(shù)。

第 15 行運(yùn)行腳本,使用 ??AwkEngine??。

像下面一樣運(yùn)行一下腳本:

$ groovy Test1Awk.groovy /etc/group
in begin
fileName /etc/group fields [root, x, 0, ]
fileName /etc/group fields [daemon, x, 1, ]
fileName /etc/group fields [bin, x, 2, ]
fileName /etc/group fields [sys, x, 3, ]
fileName /etc/group fields [adm, x, 4, syslog,clh]
fileName /etc/group fields [tty, x, 5, ]
fileName /etc/group fields [disk, x, 6, ]
fileName /etc/group fields [lp, x, 7, ]
fileName /etc/group fields [mail, x, 8, ]
fileName /etc/group fields [news, x, 9, ]
in end
78 line(s) read
$

當(dāng)然,編譯框架類生成的 ??.class??? 文件需要在 classpath 中,這樣才能正常運(yùn)行。通常你可以用 ??jar?? 把這些 class 文件打包起來。

我非常喜歡 Groovy 對(duì)行為委托的支持,這在其他語言中需要各種詭異的手段。許多年來,Java 需要匿名類和相當(dāng)多的額外代碼。Lambda 已經(jīng)在很大程度上解決了這個(gè)問題,但它們?nèi)匀徊荒芤闷浞秶獾姆?final 變量。

下面是另一個(gè)更有趣的腳本,它很容易讓人想起我對(duì) awk 的典型使用方式:

def ae = new AwkEngine(args, ';', true)
ae.onBegin = {
// nothing to do here
}
def regionCount = [:]
ae.onEachLine = { fields, recordNumber, fileName, fileRecordNumber ->
regionCount[fields.REGION] =
(regionCount.containsKey(fields.REGION) ?
regionCount[fields.REGION] : 0) +
(fields.PERSONAS as Integer)
}
ae.onEnd = {
regionCount.each { region, population ->
println “Region $region population $population”
}
}
ae.go()

第 1 行調(diào)用了三個(gè)函數(shù)的構(gòu)造方法,??true??? 表示這是“真正的 CSV” 文件,第一行為標(biāo)題。由于它是西班牙語的文件,因此它的逗號(hào)表示數(shù)字的??點(diǎn)??,標(biāo)準(zhǔn)的分隔符是分號(hào)。

第 2-4 行定義 ??onBegin()?? 閉包,這里什么也不做。

第 5 行定義一個(gè)(空的)??LinkedHashmap??,鍵是 String 類型,值是 Integer 類型。數(shù)據(jù)文件來自于智利最近的人口普查,你要在這個(gè)腳本中計(jì)算出智利每個(gè)地區(qū)的人口數(shù)量。

第 6-11 行處理文件中的行(加上標(biāo)題一共有 180,500 行)—— 請(qǐng)注意在這個(gè)案例中,由于你定義 第 1 行為 CSV 列的標(biāo)題,因此 ??fields??? 參數(shù)會(huì)成為 ??LinkedHashMap<String,String>?? 實(shí)例。

第 7-10 行是 ??regionCount??? 映射計(jì)數(shù)增加,鍵是 ??REGION??? 字段的值,值是 ??PERSONAS?? 字段的值 —— 請(qǐng)注意,與 awk 不同,在 Groovy 中你不能在賦值操作的右邊使用一個(gè)不存在的映射而期望得到空值或零值。

第 12-16 行,打印每個(gè)地區(qū)的人口數(shù)量。

第 17 行運(yùn)行腳本,調(diào)用 ??AwkEngine?? 。

像下面一樣運(yùn)行一下腳本:

$ groovy Test2Awk.groovy ~/Downloads/Censo2017/ManzanaEntidad_CSV/Censo*csv
Region 1 population 330558
Region 2 population 607534
Region 3 population 286168
Region 4 population 757586
Region 5 population 1815902
Region 6 population 914555
Region 7 population 1044950
Region 8 population 1556805
Region 16 population 480609
Region 9 population 957224
Region 10 population 828708
Region 11 population 103158
Region 12 population 166533
Region 13 population 7112808
Region 14 population 384837
Region 15 population 226068
$

以上為全部?jī)?nèi)容。對(duì)于那些喜歡 awk 但又希望得到更多的東西的人,我希望你能喜歡這種 Groovy 的方法。

責(zé)任編輯:龐桂玉 來源: Linux中國(guó)
相關(guān)推薦

2016-10-08 20:58:50

awkLinux編寫腳本

2012-11-19 11:09:15

IBMdw

2009-06-12 18:30:12

Groovy 靜態(tài)ma

2022-01-21 10:42:55

IT領(lǐng)導(dǎo)者IT事業(yè)職業(yè)顧問

2022-06-04 08:29:27

awk命令BEGIN

2019-12-09 14:13:41

awkPython編程語言

2013-04-17 10:20:27

GroovyClassLoader

2023-01-02 23:58:03

2009-12-28 10:16:48

Groovy 1.7

2013-04-26 11:39:40

2021-01-15 07:44:21

SQL注入攻擊黑客

2020-12-08 08:14:11

SQL注入數(shù)據(jù)庫

2025-08-26 10:30:01

2010-08-25 10:42:20

GroovyGroovy++

2020-09-28 18:19:15

awkLinux

2019-06-02 22:22:16

2019-11-28 08:59:03

SQL注入網(wǎng)絡(luò)攻擊網(wǎng)絡(luò)安全

2009-11-27 10:56:07

Suse模塊

2009-10-23 13:08:23

2009-12-09 09:41:56

Linux系統(tǒng)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

亚洲电影一级黄| 欧美精品v国产精品v日韩精品 | 国产一区二区91| 欧美美乳视频网站在线观看| 亚洲综合五月| 成人春色激情网| 欧美电影一区| 成人免费激情视频| 小小影院久久| 91视频8mav| 欧美成人国产| 久久国产一区| 男男成人高潮片免费网站| 亚洲春色在线视频| 久久超碰97人人做人人爱| 永久久久久久| 99精品黄色片免费大全| 国自产拍偷拍精品啪啪一区二区 | 色综合网色综合| 六十路在线观看| 欧美日韩亚洲天堂| 国产福利电影在线| 欧美日韩国产一级片| 精品三级久久久久久久电影聊斋| 亚洲图片有声小说| 调教视频vk| 中文字幕一区二区三区视频| 校园春色 亚洲色图| 久久视频中文字幕| 欧美偷拍一区二区| 免费欧美在线视频| 诱人的瑜伽老师3hd中字| 精品国产一区二区三区久久狼5月| 爱草在线视频| 国产黄色一区| 欧美激情按摩在线| 日韩亚洲精品在线观看| 亚洲日本欧美日韩高观看| 在线观看av影片| 欧美一级二区| 狠狠久久综合婷婷不卡| 精品女人视频| 亚洲尤物视频网| 日韩一区电影| baoyu777.永久免费视频| 白白色 亚洲乱淫| 亚洲精品色婷婷福利天堂| 国产一区二区三区天码| 日本xxxx高清色视频| 97国产真实伦对白精彩视频8| 国产精品乡下勾搭老头1| 91精品久久| 国产精品爽黄69| 国产亚洲精品bt天堂精选| 成人午夜在线影视| 91免费在线视频| 亚洲精选免费视频| 久久99国内| 久草免费在线播放| 亚洲欧美区自拍先锋| 香蕉久久精品| 免费女人黄页| 欧美日产国产成人免费图片| 狠狠色综合日日| 亚洲国产合集| 精品国产免费一区二区三区| 国产精品自拍网站| 亚欧黄色av| 日韩精品久久久久久久玫瑰园 | 成人xxxxx色| 国产麻豆视频一区| 午夜男人视频在线观看| 亚洲毛茸茸少妇高潮呻吟| 欧美日韩在线网站| 黄色a级片免费看| 欧美综合一区二区三区| 国产日韩中文在线中文字幕| 精品一区二区三区国产| 中文字幕欧美日韩一区| av成人 com a| 国产欧美va欧美va香蕉在| 成人h动漫精品一区二区| 黄上黄在线观看| 欧美激情高清视频| 蜜臀精品久久久久久蜜臀| 免费看成年人视频在线观看| 日韩电影中文字幕| 欧美成熟视频| 久草在线资源网站| 色妞久久福利网| 天堂成人免费av电影一区| 在线中文av| 午夜精品视频在线| 丁香网亚洲国际| 美女91在线| 精品国产乱码久久久久久丨区2区 精品国产乱码久久久久久蜜柚 | 亚洲五码在线观看视频| 色欧美片视频在线观看| 6080亚洲理论片在线观看| 日本精品福利视频| 欧美不卡在线视频| 亚洲二区免费| 中文字幕电影在线| 日韩美女免费视频| 国产精品网站在线播放| 国产女主播在线写真| 天天av综合网| 天天色综合社区| 成人免费福利在线| 日韩精选在线| 亚洲h色精品| 91在线品视觉盛宴免费| 在线观看中文字幕不卡| 欧美有码在线| 久久久久久久少妇| 中文字幕亚洲无线码a| 国产精品一区二区三区乱码| 青青在线视频| 精品国产中文字幕| 色婷婷久久综合| 97欧美在线视频| 一级在线免费观看| 成人精品视频久久久久| 一区二区三区日韩在线观看| 欧美日韩一区二区三区不卡视频| 成年人免费在线播放| 久久久国产视频| 久久久久国色av免费看影院| 麻豆精品久久| 手机在线成人免费视频| 91av在线免费观看| 亚洲三级在线免费| 日韩精品诱惑一区?区三区| 神马午夜dy888| 国产在线a不卡| 在线亚洲人成电影网站色www| 欧美视频日韩| av网址在线免费观看| 日韩影院一区| 亚洲欧美国产一本综合首页| 国内精品伊人久久久久av一坑| 高潮在线视频| 国产资源在线视频| 久久久视频在线| 亚洲国产毛片aaaaa无费看| 午夜精品婷婷| 午夜伦理大片视频在线观看| 今天免费高清在线观看国语| 久久久精品久久久久| 亚洲欧美aⅴ...| 国产综合视频| 黄频免费在线观看| 国产精品一色哟哟| 久久久久久999| 狠狠综合久久av一区二区小说| 亚洲国产黄色| 老司机成人影院| 手机视频在线观看| 国产一区二区在线免费| 激情视频一区二区三区| 国产福利视频一区二区三区| 国产精品99久久久久久久女警| 全部a∨一极品视觉盛宴| 成人免费激情视频| 欧美一区二区高清| 高清国产午夜精品久久久久久| 精品亚洲a∨一区二区三区18| 97视频网站| 国产视频不卡| 一区二区三区久久精品| 亚洲精品欧美二区三区中文字幕| 99精品国产99久久久久久福利| 日韩免费小视频| 欧美1819sex性处18免费| 亚洲va欧美va国产综合剧情| 亚洲精品720p| 亚洲免费视频成人| 久久一本综合频道| 高清一区二区三区| 国产精品va在线观看视色| 99热在线这里只有精品| 国产精品夜色7777狼人| 日韩av中文字幕在线播放| 一区二区在线观看免费视频播放| 日韩午夜激情| 一区二区三区四区高清视频 | 亚洲精品传媒| 日韩国产一级片| 91久久精品在线| 综合激情国产一区| 在线观看视频一区| 91看片淫黄大片一级| 韩国久久久久| 日韩三级网址| 日本在线观看高清完整版| **孕交吃奶水一级毛片| 欧美 国产 精品| av资源站久久亚洲| 久久理论片午夜琪琪电影网| 日韩成人激情视频|