国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

用命令行去發掘有趣的“前十”

系統
如果你喜歡做‘排名前10’之類的列表但又有點不好意思這樣說,那么告訴人們你熱愛數據的探索。為了進一步打動他們,向他們解釋你在命令行間的數據探索。但是不要告訴他們這其實很容易,以免你的好形象就這樣被毀滅了哦!

如果你喜歡做‘排名前10’之類的列表但又有點不好意思這樣說,那么告訴人們你熱愛數據的探索。為了進一步打動他們,向他們解釋你在命令行間的數據探索。但是不要告訴他們這其實很容易,以免你的好形象就這樣被毀滅了哦!

[[119768]]

在這篇文章中,我將基于GNU/Linux工具和'單列表格'(也就是我所說的簡單列表)來做一些數據探索。如若想在這里通過命令行查看更多的信息,請查看'man'頁,或者在“注釋”部分求解。

密碼

在***個列表里探討的是馬克.伯內特2011著的關于10000 個最常用的密碼匯編。這個列表是有序的、使用最頻繁的,也是廣為人知的階乘“密碼”的最常用來源之一,與“123456”并列排名第二。在這里,我把該列表放到一個名為“passwords”的文件中,并且使用head命令把排名前10的列出來了:

(伯內特解釋他是如何收集這些密碼的這里。你會注意到在列表中他把所有大寫字母都轉換成小寫的。)

OK,所以'password'是伯內特列表的頂部。那么每個數字呢?

非常有趣的是!數字'1'出現在密碼列表中的次數多于第二個最常用數字'2'的兩倍,而且,除了0和9之外,這十個數字出現的次數以其數字順序排列。而排名前10的字母呢?

在 passwords 文件中出現最頻繁的字母依次是EARONISTLC,類似于EAIRTONSLC,這是至少一個出版的表格中提到的常用英文單詞中出現的字頻。這是否意味著,大部分密碼其實是一些常見的英語單詞呢,也許會參雜一些數字呢?

為了找到答案,我先把密碼轉換成一個純字母的字符串列表,然后看看有多少字符串是可以在英語詞典中找到的。

首先我將通過 sed 命令刪除所有密碼中的數字,然后刪除所有的標點符號,再刪除所有的空行。這將創建出一個純字母的密碼列表。然后我通過sortuniq來修剪列表的排序,將重復項取出。(例如,'abc1234def'和'abc1!2!3!def!'都剔除剩下'abcdef'.) 。根據wc命令,我把1000個密碼減至成8583個純字母的字符串:

我經常使用一本便攜式的英語字典,我通常會使用usr/share/dict/american-english,這個文件是來自Debian Linux的一個發行版本。它包含了99171個單詞。我會先通過tr命令將這個詞表轉換為純小寫的,然后使用sortuniq刪除掉任何重復的條目排序(例如'A' 和 'a' 都將成為 'a')。這樣就將詞表的數量減至97723項了:

我現在可以用comm命令及'-23'的參數來比較兩個列表,并報告純字母文件中而沒有出現在字典中的單詞:

總數是3137,所以至少有8583 -3137 = 5446個'核心'密碼在伯納特的純小寫字母列表中(大約63%)是簡單的英語單詞,或者是簡單的單詞附加一些數字或者標點符號。我之所以說“至少”,是因為在3137個字符串中有很大比例是只有經過輕微修改的純英語單詞、名稱、或者在/usr/share字典中未能找到的名稱修改而成的。在LA項中,例如,'labtec', 'ladyboy', 'lakeside', 'lalakers', 'lalala', 'laserjet', 'lasvegas', 'lavalamp' 和 'lawman'.

地名

在之前的一篇Linux Rain article,我描述了如何建立一張37萬項澳大利亞的地名表。有了它,我現在可以回答一些類似這樣的關鍵問題“Round Hill是澳大利亞山脈中***的名字嗎?”和“桑迪是沙灘之最,而巖溪峽谷呢?”

在地名表中地名字段的排名第2,所以這里有:

哇。我當時甚至沒有關閉這個終端。(但是請注意到我是如何通過^string1^string2命令保存打印的內容。它重復著***一個命令,但是用第2個字符串代替了第1個字符串。這是多么有用的BASH絕招!)

另一個亟待解決的問題是有多少地名有'Mile'在其中,例如'Six Mile Creek',而他們的排名又是如何:

我在我的澳洲之旅發現有很多Dead Horse Creeks,因此有這些地名:

種類

第三個列表是探索我今年出版的1961-2010年期間澳大利亞新種類昆蟲名。從這個列表中,我去掉所有“物種的綽號”,就是種群組合的第二部分,比如像智人(你和我)和西方蜜蜂(歐洲蜜蜂)。

(科技小貼士:這個昆蟲表,可以從開發數據Zenodo庫中https://zenodo.org/record/10481取得,包括亞種。在我的‘top 10’練習中,我首先分離出所有獨特的種群組合,這樣避免了重復的,例如蜜蜂iberica的亞種,以避免蜜蜂的綽號intermissa,等等。***一個物種文件有18155個綽號。)

大多數人講科學名稱帶玩笑式地用'-us'結局,如'Biggus buggus'。那么昆蟲學家呢?有幾個不錯的,用命令行的方式獲取字符串的***2個字母,在這里我都會用到這2個:

耶!昆蟲學家喜歡也‘-us’結尾。接下來,我不知道有多少物種是以我的家鄉Tasmania州來命名的?(下面我想看看前100行,來確保我得到的所有'tasman'組合.)

那么昆士蘭呢?

一般來說,昆蟲物種名單中的前10名分別是什么呢?

嗯,除了明顯的'australis'和'australiensis',而地理方面的'occidentalis'(西部),另外昆蟲學家創建7個在10個***列表中的綽號已經履行了其它昆蟲學家的意愿。(綽號'commoni'是給澳大利亞蝴蝶和蛾專家Ian F.B. Common[1917-2006]的榮譽。)

演變

上面的這些命令用在簡單列表上。要從簡單的列表變成文本塊,那就再次需要我們的命令行朋友了。例如,我把澳大利亞參議院于2014年7月16日的演講保存成文本文件hansard。將hansard分割成一個單詞列表:

現在看看講話中的單詞使用頻率:

即將推出...

從多列的表中做'top 10'等排名,需要更多些的命令行工具。我將會在未來的文章中證明他們的用處。

原文鏈接:http://linux.cn/article-3775-1.html

責任編輯:牛小雨 來源: linux中國
相關推薦

2010-12-02 14:29:07

nmap

2010-05-17 15:41:26

2015-05-25 10:40:22

Linux命令行技巧

2018-11-08 14:50:14

2021-03-20 21:43:17

LibreOffice命令行開源

2013-12-03 09:23:06

命令行網速

2018-01-24 15:42:49

命令功能程序

2010-05-25 18:43:39

MySQL命令行

2012-11-20 16:16:05

Windows

2010-08-25 21:03:38

命令行DHCP

2014-10-31 10:50:28

Linux命令行工具

2022-04-05 00:18:33

工具終端命令行

2022-07-13 08:21:38

開源命令行工具Linux

2011-09-06 16:17:50

Ubuntu

2024-11-18 15:05:34

MySQL數據庫

2019-06-17 09:30:50

命令行Windows 10管理密碼

2015-07-01 09:15:46

linuxQuora命令行

2017-01-16 15:12:36

Linuxwatch命令命令

2014-12-05 10:10:48

Java

2012-03-08 10:03:11

JavaClass
點贊
收藏

51CTO技術棧公眾號

你微笑时很美电视剧整集高清不卡| 成人在线观看一区| 一区二区美女| 日韩三级视频中文字幕| 福利视频网站| 国模无码大尺度一区二区三区| 海角国产乱辈乱精品视频| 色猫av在线| 国产午夜一区二区三区| 少妇免费毛片久久久久久久久| 欧美日韩破处| 久久精品国产一区二区三区| 毛片激情在线观看| 亚洲香蕉伊在人在线观| 日本在线视频www| 精品综合久久久久久8888| 国产精品播放| 久久精品高清| 欧美亚洲第一区| 国外成人福利视频| 精品视频偷偷看在线观看| av影片在线看| 日本道在线观看一区二区| 免费xxxxx网站中文字幕| 欧美激情一区二区三区在线| 男人添女人下部视频免费| 国产精品老牛| 99久久国产免费免费| 欧美精品色图| 国产91精品高潮白浆喷水| 美女91在线| 91在线播放视频| 国内精品麻豆美女在线播放视频| 一区在线播放视频| 欧美日韩一区二区视频在线| 成人福利电影精品一区二区在线观看 | 亚洲色婷婷久久精品av蜜桃| 国内精品久久久久久久影视蜜臀| 国产精品精品视频| 精品免费一区二区| 日本乱人伦a精品| 日韩理论电影中文字幕| 欧美激情图片区| 99ri日韩精品视频| 97免费视频在线| 亚洲第一二三区| 午夜精品久久久久久久久久久久久| 成人黄色理论片| 九九九久久久久久| 91蜜桃臀久久一区二区| 国内揄拍国内精品少妇国语| 亚洲网一区二区三区| 欧美夫妻性生活xx| 欧美日韩一区二区三区不卡视频| 久久免费成人精品视频| 亚洲欧洲色图| 18成人免费观看网站下载| 欧美日韩国产免费观看| 韩国成人动漫在线观看| 日本欧美韩国一区三区| 无码毛片aaa在线| 久久久久久亚洲综合| 久久99999| 午夜久久久久久久久久一区二区| 久草视频视频在线播放| 91精品国产综合久久精品app| 欧美gv在线观看| 久久手机免费视频| 国产精品片aa在线观看| 国产v日产∨综合v精品视频| 欧美高清视频不卡网| 欧美videossex| www.亚洲人.com| 久久久久97| 国产在线精品一区二区三区》| 麻豆国产精品一区二区三区| 欧美性大战久久久久xxx| 亚洲成人资源网| 超碰在线最新网址| 久久久伊人欧美| 国产日本精品| 欧美亚洲精品一区二区| 亚洲国产另类av| 午夜小视频福利在线观看| 伦理中文字幕亚洲| 欧美日本亚洲韩国国产| 久久亚洲国产成人精品无码区 | 久久精品人人做人人爽电影蜜月| 国产综合欧美在线看| 九九九热精品免费视频观看网站| 波多野在线观看| 国产乱码精品一区二区三| 天天色综合社区| 欧美日韩国产美女| 亚洲色图综合| 波多野结衣精品久久| 国产99久久久国产精品免费看| 日本在线免费观看视频| 精品欧美久久久| 大伊香蕉精品在线品播放| 99在线观看视频| 国产三级欧美三级日产三级99| 国产视频第一页在线观看| 色妞色视频一区二区三区四区| 日韩系列欧美系列| 国产不卡一区二区视频| 欧美怡红院视频| 欧美色网在线| 精品免费视频123区| 中文字幕免费一区| av日韩国产| 99re在线视频观看| 国产欧美1区2区3区| 午夜激情在线| 91日本视频在线| 亚洲国产高清在线| 亚洲国产成人二区| 国产在线一区二区三区欧美| 欧美激情综合在线| 人人草在线视频| 国产麻豆日韩| 午夜天堂影视香蕉久久| 老司机亚洲精品一区二区| 天堂社区 天堂综合网 天堂资源最新版 | 亚洲免费观看在线视频| 日本免费一区二区三区四区| 欧美综合一区| 麻豆免费网站| 精品国产一区二区三区无码| 亚洲欧美日韩小说| 色999韩欧美国产综合俺来也| 久久久福利视频| 狠狠躁夜夜躁人人爽天天天天97 | 不卡视频在线观看| 日本不卡影院| 古典武侠综合av第一页| 亚洲午夜电影在线| 欧美电影免费网站| 美女福利视频在线| 正在播放亚洲1区| 久久爱www久久做| 黄av在线免费观看| 国产精品一区二区三区四区五区 | 欧美黑人猛交的在线视频| 亚洲综合日韩在线| 香蕉乱码成人久久天堂爱免费| 老牛影视av一区二区在线观看| 日韩人妻精品无码一区二区三区| 亚洲免费视频一区二区| 日韩av不卡一区二区| 免费人成在线观看播放视频| 91色p视频在线| 欧美性极品xxxx做受| 99久久婷婷| 嫩草在线播放| 国产精品嫩草在线观看| 欧美色另类天堂2015| 亚洲精品久久| av在线女优影院| 免费看污久久久| 精品国产制服丝袜高跟| 日韩av电影一区| 日产福利视频在线观看| 性生活免费观看视频| 一个色综合导航| 久久久久国产一区二区三区四区| 91麻豆精品国产综合久久久| 高清在线观看免费| 欧美人与物videos| 国产精品乱人伦一区二区| 国产精品对白| 动漫成人在线观看| 成人欧美视频在线| 亚洲成年人影院在线| 成人午夜精品在线| xvideos.蜜桃一区二区| 富二代精品短视频| аⅴ资源新版在线天堂| 久久一区二区三区av| 亚洲精品国产精品国自产观看浪潮| 激情欧美一区二区| 中文字幕一区图| 伊人网站在线| 日韩理论片在线观看| 亚洲欧美资源在线| 中文字幕免费不卡在线| 老司机午夜激情| 91亚洲精品| 欧一区二区三区| 亚洲一区制服诱惑| 欧美日韩成人综合在线一区二区 | 亚洲成年网站在线观看| 国产精品1区二区.| 西野翔中文久久精品国产| 日韩亚洲视频在线观看| 日韩视频精品| 成年人精品视频| 精品久久久久久中文字幕一区奶水| 亚洲最新色图| 成年人在线网站|