awk命令、awk編程語言詳細(xì)介紹和實(shí)例
一,什么是awk
awk是linux下的一個(gè)命令,他對其他命令的輸出,對文件的處理都十分強(qiáng)大,其實(shí)他更像一門編程語言,他可以自定義變量,有條件語句,有循環(huán),有數(shù)組,有正則,有函數(shù)等。他讀取輸出,或者文件的方式是一行,一行的讀,根據(jù)你給出的條件進(jìn)行查找,并在找出來的行中進(jìn)行操作,感覺他的設(shè)計(jì)思想,真的很簡單,但是結(jié)合實(shí)際情況,具體操作起來就沒有那么簡單了。他有三種形勢,awk,gawk,nawk,平時(shí)所說的awk其實(shí)就是gawk。
二,awk中的記錄,域,分割符
當(dāng)我們讀取輸出時(shí),或者讀取文件時(shí),讀取一行就是一個(gè)記錄。記錄分割符是默認(rèn)是回車符,保存在RS,ORS中。
我們從記錄中分割出我們要單詞,或者是詞組等,我們稱他為域,域分割符,默認(rèn)的是空格和TAB銉,保存在內(nèi)建變
量ORS中。舉個(gè)例子:
aaaa:bbbb:ccccccc
1111:2343:5t43343
上面有二行,這二行就是二個(gè)記錄,每行后面的回車呢,就是記錄分割符,里面冒號呢,就是域分割符,分割出來的,aaaa,1111這類東西就是域了。
awk -F: '{print $1}' testfile
三,awk的內(nèi)建變量和運(yùn)算符
1,變量
變 量 | 描述 |
---|---|
$n | 當(dāng)前記錄的第n個(gè)字段,字段間由 FS分隔。 |
$0 | 完整的輸入記錄。 |
ARGC | 命 令行參數(shù)的數(shù)目。 |
ARGIND | 命令行中當(dāng)前文件的位置(從0開始算)。 |
ARGV | 包 含命令行參數(shù)的數(shù)組。 |
CONVFMT | 數(shù)字轉(zhuǎn)換格式(默認(rèn)值為%.6g) |
ENVIRON | 環(huán) 境變量關(guān)聯(lián)數(shù)組。 |
ERRNO | 最后一個(gè)系統(tǒng)錯(cuò)誤的描述。 |
FIELDWIDTHS | 字 段寬度列表(用空格鍵分隔)。 |
FILENAME | 當(dāng)前文件名。 |
FNR | 同 NR,但相對于當(dāng)前文件。 |
FS | 字段分隔符(默認(rèn)是任何空格)。 |
IGNORECASE | 如 果為真,則進(jìn)行忽略大小寫的匹配。 |
NF | 當(dāng)前記錄中的字段數(shù)。 |
NR | 當(dāng) 前記錄數(shù)。 |
OFMT | 數(shù)字的輸出格式(默認(rèn)值是%.6g)。 |
OFS | 輸 出字段分隔符(默認(rèn)值是一個(gè)空格)。 |
ORS | 輸出記錄分隔符(默認(rèn)值是一個(gè)換行符)。 |
RLENGTH | 由 match函數(shù)所匹配的字符串的長度。 |
RS | 記錄分隔符(默認(rèn)是一個(gè)換行符)。 |
RSTART | 由 match函數(shù)所匹配的字符串的第一個(gè)位置。 |
SUBSEP | 數(shù)組下標(biāo)分隔符(默認(rèn)值是\034)。 |
2,運(yùn)算符
運(yùn)算符 | 描述 |
---|---|
= += -= *= /= %= ^= **= | 賦值 |
?: | C條件表達(dá)式 |
|| | 邏 輯或 |
&& | 邏輯與 |
~ ~! | 匹 配正則表達(dá)式和不匹配正則表達(dá)式 |
< <= > >= != == | 關(guān) 系運(yùn)算符 |
空格 | 連接 |
+ - | 加,減 |
* / & | 乘,除與求余 |
+ - ! | 一元加,減和邏輯非 |
^ *** | 求冪 |
++ -- | 增加或減少,作為前綴或后綴 |
$ | 字 段引用 |
in | 數(shù)組成員 |
四,awk的正則
匹配符 | 描述 |
---|---|
\Y | 匹配一個(gè)單詞開頭或者末尾的空字符串 |
\B | 匹配單詞內(nèi)的空字符串 |
\< | 匹配一個(gè)單詞的開頭的空字符串,錨定開始 |
\> | 匹配一個(gè)單詞的末尾的空字符串,錨定末尾 |
\W | 匹配一個(gè)非字母數(shù)字組成的單詞 |
\w | 匹配一個(gè)字母數(shù)字組成的單詞 |
\' | 匹配字符串末尾的一個(gè)空字符串 |
\‘ | 匹配字符串開頭的一個(gè)空字符串 |
五,awk的函數(shù)
1,字符串函數(shù)
函數(shù)名 | 描述 |
---|---|
sub | 匹配記錄中最大、最靠左邊的子字符串的正則表達(dá)式,并用替換字符串替換這些字符串。如果沒有指定目標(biāo)字符串就默認(rèn)使用整個(gè)記錄。替換只發(fā)生在第一次匹配的 時(shí)候 |
gsub | 整個(gè)文檔中進(jìn)行匹配 |
index | 返回子字符串第一次被匹配的位置,偏移量從位置1開始 |
substr | 返回從位置1開始的子字符串,如果指定長度超過實(shí)際長度,就返回整個(gè)字符串 |
split | 可按給定的分隔符把字符串分割為一個(gè)數(shù)組。如果分隔符沒提供,則按當(dāng)前FS值進(jìn)行分割 |
length | 返回記錄的字符數(shù) |
match | 返回在字符串中正則表達(dá)式位置的索引,如果找不到指定的正則表達(dá)式則返回0。match函數(shù)會設(shè)置內(nèi)建變量RSTART為字符串中子字符串的開始位 置,RLENGTH為到子字符串末尾的字符個(gè)數(shù)。substr可利于這些變量來截取字符串 |
toupper和tolower | 可用于字符串大小間的轉(zhuǎn)換,該功能只在gawk中有效 |
2,數(shù)學(xué)函數(shù)
函數(shù)名 | 返回值 |
---|---|
atan2(x,y) | y,x 范圍內(nèi)的余切 |
cos(x) | 余弦函數(shù) |
exp(x) | 求 冪 |
int(x) | 取整 |
log(x) | 自然對 數(shù) |
rand() | 隨機(jī)數(shù) |
sin(x) | 正弦 |
sqrt(x) | 平 方根 |
srand(x) | x是rand()函數(shù)的種子 |
int(x) | 取 整,過程沒有舍入 |
rand() | 產(chǎn)生一個(gè)大于等于0而小于1的隨機(jī)數(shù) |
六,實(shí)例
學(xué)習(xí)awk的時(shí)候,做了一個(gè)例子,學(xué)東西,不要光看,光看是記不住東西的。光看的話,也許你知道怎么回事,真正實(shí)際操作,不是這兒有問題,就是那兒有問題。所以一定要動手親自操作一下。
1,測試文件test
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/bin/false
daemon:x:2:2:daemon:/sbin:/bin/false
mail:x:8:12:mail:/var/spool/mail:/bin/false
ftp:x:14:11:ftp:/home/ftp:/bin/false
&nobody:$:99:99:nobody:/:/bin/false
zhangy:x:1000:100:,,,:/home/zhangy:/bin/bash
http:x:33:33::/srv/http:/bin/false
dbus:x:81:81:System message bus:/:/bin/false
hal:x:82:82:HAL daemon:/:/bin/false
mysql:x:89:89::/var/lib/mysql:/bin/false
aaa:x:1001:1001::/home/aaa:/bin/bash
ba:x:1002:1002::/home/zhangy:/bin/bash
test:x:1003:1003::/home/test:/bin/bash
@zhangying:*:1004:1004::/home/test:/bin/bash
policykit:x:102:1005:Po
例1:
cat test | awk -F: '{\
if ($1 == "root"){\
print $1;\
}else if($1 == "bin"){\
print $2;\
}else{\
print $3;\
} \
}'
例2:
awk '{\
for(i=0;i<NF;i++){\
if ($i ~/^root/){\
print $i;\
}else if($i ~/zhangy/){\
print $i;continue;\
}else if($i ~/mysql/){\
print $i;next;\
}else if($i ~/^test/){\
print $i;break;\
} \
}\
}' test
例3:
tail test | awk 'BEGIN{while(getline d){ split(d,test);for(i in test){\
print test[i]\
}}}'
例4:
ls -al /home/zhangy/mytest | awk 'BEGIN{while(getline d){ split(d,test);\
print test[9] ;}
}'
例5:
echo "32:34" |awk -F: '{print "max = ",max($1,$2)}\
function max(one,two){
if(one > two){
return one;
}else{
return two;
}
}
'
例6:
#awk 'BEGIN{print "what is your name"; getline name < "/dev/tty"}$1 ~name{print
#"found name on line" NR}END{print "see you" name}' test
#awk '{sub(/daemon/,"tankzhang");print}' test
#awk '{{sub(/zhangy/,"tankzhang");$1};print}' test
#awk '{{gsub(/zhangy/,"tankzhang");$1};print}' test
#awk -F: '{print index("zhangy",$1)}' test
#awk -F: '{print substr($1,1,2)}' test
awk -F: '{mat=match($1,/^[a-zA-Z]+$/);print mat,RSTART,RLENGTH}' test
例7:
cat test |awk -F: '\
NF != 7{\
printf("line %d,does not have 7 fields:%s\n",NR,$0)}\
$1 !~ /^[A-Za-z0-9]/{printf("line %d,non alpha and numeric user id:%s: %s\n",NR,$1,$0)}\
$2 == "*" {printf("lind %d,no password:%s\n",NR,$0)}'
- 詳解Linx awk 入門教程
- Linux中的awk數(shù)組的基本使用方法
- 淺談linux中sed命令和awk命令的使用
- LINUX中詳解AWK內(nèi)建變量FS,NF,NR,RT,RS,ORS,OFS
- Linux中 sed 和 awk的用法詳解
- 一天一個(gè)shell命令 linux文本內(nèi)容操作系列-awk命令詳解
- linux正則表達(dá)式awk詳解
- awk正則表達(dá)式和內(nèi)置函數(shù)的使用方法實(shí)例詳解
- Shell正則表達(dá)式之grep、sed、awk實(shí)操筆記
- 馬爾可夫鏈算法(markov算法)的awk、C++、C語言實(shí)現(xiàn)代碼
- Linux awk將文件某列按照逗號分隔的例子
相關(guān)文章
shell判斷文件,目錄是否存在或者具有權(quán)限的代碼
因shell還不是很熟練,所以做此筆記,方便查看,學(xué)習(xí)shell的朋友可以參考下2013-06-06linux crontab 實(shí)現(xiàn)每秒執(zhí)行的實(shí)例
下面小編就為大家?guī)硪黄猯inux crontab 實(shí)現(xiàn)每秒執(zhí)行的實(shí)例。小編覺得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧2017-04-04一些Linux Shell中的權(quán)限相關(guān)知識總結(jié)
這篇文章主要介紹了一些Linux Shell中的權(quán)限相關(guān)知識總結(jié),使Linux入門學(xué)習(xí)中的基礎(chǔ)知識,需要的朋友可以參考下2015-07-07Shell $?獲取函數(shù)返回值或者上一個(gè)命令的退出狀態(tài)
這篇文章主要介紹了Shell $?獲取函數(shù)返回值或者上一個(gè)命令的退出狀態(tài),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2021-01-01