詳解Linux中的awk命令
簡介
awk是一個強大的文本分析工具,相對于grep的查找,sed的編輯,awk在其對數(shù)據(jù)分析并生成報告時,顯得尤為強大。簡單來說awk就是把文件逐行的讀入,以空格為默認分隔符將每行切片,切開的部分再進行各種分析處理。
awk有3個不同版本: awk、nawk和gawk,未作特別說明,一般指gawk,gawk 是 AWK 的 GNU 版本。
awk其名稱得自于它的創(chuàng)始人 Alfred Aho 、Peter Weinberger 和 Brian Kernighan 姓氏的首個字母。實際上 AWK 的確擁有自己的語言: AWK 程序設(shè)計語言 , 三位創(chuàng)建者已將它正式定義為“樣式掃描和處理語言”。它允許您創(chuàng)建簡短的程序,這些程序讀取輸入文件、為數(shù)據(jù)排序、處理數(shù)據(jù)、對輸入執(zhí)行計算以及生成報表,還有無數(shù)其他的功能。
一、選項參數(shù)說明
awk是一種處理文本文件的語言,我們可以使用awk --help查看一下它的選項參數(shù),如下:
二、基本用法
1、行匹配語句,此處awk后只能跟單引號,格式如下:
awk '{匹配的內(nèi)容}' 匹配的文件名稱
例如:
現(xiàn)有如下測試文件test:
使用如下命令輸出文中每行的1、4項內(nèi)容:
awk '{print $1,$4}' test
也可以添加如下內(nèi)容使其格式化輸出:
awk '{printf "%-8s %-10s\n",$1,$4}' test
2、指定分隔符
awk '{printf "%-8s %-10s\n",$1,$4}' test
例如:
有如下test文件:
執(zhí)行如下命令,使用逗號分割輸出每行的第一、二項內(nèi)容:
awk -F, '{print $1,$2}' test
也可以使用內(nèi)建變量,格式如下:
awk 'BEGIN{FS=","} {print $1,$2}' test
對于使用多個分隔符,首先使用空格分割,然后再使用其他分割符進行分割:
awk -F '[ ,]' '{print $1,$2,$4}' test
3、設(shè)置變量
awk -v
例如:
現(xiàn)有如下數(shù)據(jù):
執(zhí)行如下命令,每行第一項加1:
awk -va=1 '{print $1,$1+a}' test
也可以使用如下命令設(shè)置多個變量:
awk -va=1 -vb=s '{print $1,$1+a,$1b}' test
4、通過awk腳本來運行awk命令
awk -f awk腳本 文件名
例如:
awk -f file.awk test
三、運算符
例如:
1、過濾第一列大于2的行
awk '$1>2' test
2、過濾等于2的列
awk '$1==2 {print $1,$3}' test
3、過濾第一列大于2并且第二列等于Are的行
awk '$1>2 && $2=="Are" {print $1,$2,$3}' test
四、內(nèi)建變量
例如:
awk 'BEGIN{printf "%4s %4s %4s %4s %4s %4s %4s %4s %4s\n","FILENAME","ARGC","FNR","FS","NF","NR","OFS","ORS","RS";printf "---------------------------------------------\n"} {printf "%4s %4s %4s %4s %4s %4s %4s %4s %4s\n",FILENAME,ARGC,FNR,FS,NF,NR,OFS,ORS,RS}' test
awk -F\' 'BEGIN{printf "%4s %4s %4s %4s %4s %4s %4s %4s %4s\n","FILENAME","ARGC","FNR","FS","NF","NR","OFS","ORS","RS";printf "---------------------------------------------\n"} {printf "%4s %4s %4s %4s %4s %4s %4s %4s %4s\n",FILENAME,ARGC,FNR,FS,NF,NR,OFS,ORS,RS}' test
awk '{print NR,FNR,$1,$2,$3}' test
awk '{print $1,$2,$5}' OFS=" $ " test
五、使用正則,字符串匹配
例如:
1、輸出第二列包含“th”并打印第二列與第四列。
awk '$2 ~ /th/ {print $2,$4}' test
~表示模式開始,//中存放匹配的模式。
2、輸出包含“re”的行
awk '/re/ ' test
六、忽略大小寫
awk 'BEGIN{IGNORECASE=1} /this/' test
七、模式取反
awk '$2 !~ /th/ {print $2,$4}' test
awk '!/th/ {print $2,$4}' test
八、awk腳本
關(guān)于awk腳本,需要注意BEGIN和END兩個關(guān)鍵詞:
(1)BEGIN{存放執(zhí)行前的語句};
(2)END{存放處理完所有的行后要執(zhí)行的語句}。
例如:
現(xiàn)有數(shù)據(jù)如下:
我們的awk腳本內(nèi)容如下:
執(zhí)行結(jié)果如下:
總結(jié)
以上所述是小編給大家介紹的Linux中的awk命令,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復(fù)大家的。在此也非常感謝大家對腳本之家網(wǎng)站的支持!
如果你覺得本文對你有幫助,歡迎轉(zhuǎn)載,煩請注明出處,謝謝!
相關(guān)文章
Shell命令行中特殊字符與其轉(zhuǎn)義詳解(去除特殊含義)
這篇文章主要給大家詳細介紹了Shell命令行中特殊字符與其轉(zhuǎn)義(去除特殊含義)的相關(guān)資料,文中介紹的很詳細,相信對大家具有一定的參考價值,有需要的朋友們下面來一起看吧。2017-02-02Shell腳本中執(zhí)行sql語句操作mysql的5種方法
這篇文章主要介紹了Shell腳本中執(zhí)行sql語句操作mysql的5種方法,本文講解了將SQL語句直接嵌入到shell腳本文件中、命令行調(diào)用單獨的SQL文件、使用管道符調(diào)用SQL文件等方法,需要的朋友可以參考下2014-10-10linux 中more、less 和 most 的區(qū)別
more 是一個老式的、基礎(chǔ)的終端分頁閱讀器,它可以用于打開指定的文件并進行交互式閱讀。這篇文章主要給大家介紹linux 中more、less 和 most 的區(qū)別,感興趣的朋友跟隨小編一起看看吧2018-11-11