快捷導(dǎo)航

awk命令、awk編程語言詳細(xì)介紹和實(shí)例

更新時(shí)間：2014年07月29日 09:56:25 投稿：junjie

這篇文章主要介紹了awk命令、awk編程語言詳細(xì)介紹和實(shí)例,講解了如awk中的記錄、域、分割符,awk的內(nèi)建變量和運(yùn)算符等,需要的朋友可以參考下

一，什么是awk

awk是linux下的一個(gè)命令，他對其他命令的輸出，對文件的處理都十分強(qiáng)大，其實(shí)他更像一門編程語言，他可以自定義變量，有條件語句，有循環(huán)，有數(shù)組，有正則，有函數(shù)等。他讀取輸出，或者文件的方式是一行，一行的讀，根據(jù)你給出的條件進(jìn)行查找，并在找出來的行中進(jìn)行操作，感覺他的設(shè)計(jì)思想，真的很簡單，但是結(jié)合實(shí)際情況，具體操作起來就沒有那么簡單了。他有三種形勢，awk，gawk，nawk，平時(shí)所說的awk其實(shí)就是gawk。

二，awk中的記錄，域，分割符

當(dāng)我們讀取輸出時(shí)，或者讀取文件時(shí)，讀取一行就是一個(gè)記錄。記錄分割符是默認(rèn)是回車符，保存在RS，ORS中。
我們從記錄中分割出我們要單詞，或者是詞組等，我們稱他為域，域分割符，默認(rèn)的是空格和TAB銉，保存在內(nèi)建變
量ORS中。舉個(gè)例子：
aaaa:bbbb:ccccccc
1111:2343:5t43343
上面有二行，這二行就是二個(gè)記錄，每行后面的回車呢，就是記錄分割符，里面冒號呢，就是域分割符，分割出來的，aaaa,1111這類東西就是域了。
awk -F: '{print $1}' testfile

三，awk的內(nèi)建變量和運(yùn)算符

1，變量

變量	描述
$n	當(dāng)前記錄的第n個(gè)字段，字段間由 FS分隔。
$0	完整的輸入記錄。
ARGC	命令行參數(shù)的數(shù)目。
ARGIND	命令行中當(dāng)前文件的位置(從0開始算)。
ARGV	包含命令行參數(shù)的數(shù)組。
CONVFMT	數(shù)字轉(zhuǎn)換格式(默認(rèn)值為%.6g)
ENVIRON	環(huán) 境變量關(guān)聯(lián)數(shù)組。
ERRNO	最后一個(gè)系統(tǒng)錯(cuò)誤的描述。
FIELDWIDTHS	字段寬度列表(用空格鍵分隔)。
FILENAME	當(dāng)前文件名。
FNR	同 NR，但相對于當(dāng)前文件。
FS	字段分隔符(默認(rèn)是任何空格)。
IGNORECASE	如果為真，則進(jìn)行忽略大小寫的匹配。
NF	當(dāng)前記錄中的字段數(shù)。
NR	當(dāng) 前記錄數(shù)。
OFMT	數(shù)字的輸出格式(默認(rèn)值是%.6g)。
OFS	輸出字段分隔符(默認(rèn)值是一個(gè)空格)。
ORS	輸出記錄分隔符(默認(rèn)值是一個(gè)換行符)。
RLENGTH	由 match函數(shù)所匹配的字符串的長度。
RS	記錄分隔符(默認(rèn)是一個(gè)換行符)。
RSTART	由 match函數(shù)所匹配的字符串的第一個(gè)位置。
SUBSEP	數(shù)組下標(biāo)分隔符(默認(rèn)值是\034)。

2，運(yùn)算符

運(yùn)算符	描述
= += -= = /= %= ^= *=	賦值
?:	C條件表達(dá)式
\|\|	邏輯或
&&	邏輯與
~ ~!	匹配正則表達(dá)式和不匹配正則表達(dá)式
< <= > >= != ==	關(guān) 系運(yùn)算符
空格	連接
+ -	加，減
* / &	乘，除與求余
+ - !	一元加，減和邏輯非
^ ***	求冪
++ --	增加或減少，作為前綴或后綴
$	字段引用
in	數(shù)組成員

四，awk的正則

匹配符	描述
\Y	匹配一個(gè)單詞開頭或者末尾的空字符串
\B	匹配單詞內(nèi)的空字符串
\<	匹配一個(gè)單詞的開頭的空字符串，錨定開始
\>	匹配一個(gè)單詞的末尾的空字符串，錨定末尾
\W	匹配一個(gè)非字母數(shù)字組成的單詞
\w	匹配一個(gè)字母數(shù)字組成的單詞
\'	匹配字符串末尾的一個(gè)空字符串
\‘	匹配字符串開頭的一個(gè)空字符串

五，awk的函數(shù)

1，字符串函數(shù)

函數(shù)名	描述
sub	匹配記錄中最大、最靠左邊的子字符串的正則表達(dá)式，并用替換字符串替換這些字符串。如果沒有指定目標(biāo)字符串就默認(rèn)使用整個(gè)記錄。替換只發(fā)生在第一次匹配的時(shí)候
gsub	整個(gè)文檔中進(jìn)行匹配
index	返回子字符串第一次被匹配的位置，偏移量從位置1開始
substr	返回從位置1開始的子字符串，如果指定長度超過實(shí)際長度，就返回整個(gè)字符串
split	可按給定的分隔符把字符串分割為一個(gè)數(shù)組。如果分隔符沒提供，則按當(dāng)前FS值進(jìn)行分割
length	返回記錄的字符數(shù)
match	返回在字符串中正則表達(dá)式位置的索引，如果找不到指定的正則表達(dá)式則返回0。match函數(shù)會設(shè)置內(nèi)建變量RSTART為字符串中子字符串的開始位置，RLENGTH為到子字符串末尾的字符個(gè)數(shù)。substr可利于這些變量來截取字符串
toupper和tolower	可用于字符串大小間的轉(zhuǎn)換，該功能只在gawk中有效

2，數(shù)學(xué)函數(shù)

函數(shù)名	返回值
atan2(x,y)	y,x 范圍內(nèi)的余切
cos(x)	余弦函數(shù)
exp(x)	求冪
int(x)	取整
log(x)	自然對數(shù)
rand()	隨機(jī)數(shù)
sin(x)	正弦
sqrt(x)	平方根
srand(x)	x是rand()函數(shù)的種子
int(x)	取整，過程沒有舍入
rand()	產(chǎn)生一個(gè)大于等于0而小于1的隨機(jī)數(shù)

六，實(shí)例

學(xué)習(xí)awk的時(shí)候，做了一個(gè)例子，學(xué)東西，不要光看，光看是記不住東西的。光看的話，也許你知道怎么回事，真正實(shí)際操作，不是這兒有問題，就是那兒有問題。所以一定要動手親自操作一下。

1，測試文件test

復(fù)制代碼代碼如下:

root:x:0:0:root:/root:/bin/bash

bin:x:1:1:bin:/bin:/bin/false

daemon:x:2:2:daemon:/sbin:/bin/false

mail:x:8:12:mail:/var/spool/mail:/bin/false

ftp:x:14:11:ftp:/home/ftp:/bin/false

&nobody:$:99:99:nobody:/:/bin/false

zhangy:x:1000:100:,,,:/home/zhangy:/bin/bash

http:x:33:33::/srv/http:/bin/false

dbus:x:81:81:System message bus:/:/bin/false

hal:x:82:82:HAL daemon:/:/bin/false

mysql:x:89:89::/var/lib/mysql:/bin/false

aaa:x:1001:1001::/home/aaa:/bin/bash

ba:x:1002:1002::/home/zhangy:/bin/bash

test:x:1003:1003::/home/test:/bin/bash

@zhangying:*:1004:1004::/home/test:/bin/bash

policykit:x:102:1005:Po

例1：

復(fù)制代碼代碼如下:

cat test | awk -F: '{\

 if ($1 == "root"){\

 print $1;\

 }else if($1 == "bin"){\

 print $2;\

 }else{\

 print $3;\

 } \

}'

例2：

復(fù)制代碼代碼如下:

awk '{\

 for(i=0;i<NF;i++){\

 if ($i ~/^root/){\

 print $i;\

 }else if($i ~/zhangy/){\

 print $i;continue;\

 }else if($i ~/mysql/){\

 print $i;next;\

 }else if($i ~/^test/){\

 print $i;break;\

 } \

 }\

}' test

例3：

復(fù)制代碼代碼如下:

tail test | awk 'BEGIN{while(getline d){ split(d,test);for(i in test){\

 print test[i]\

}}}'

例4：

復(fù)制代碼代碼如下:

ls -al /home/zhangy/mytest | awk 'BEGIN{while(getline d){ split(d,test);\

 print test[9] ;}

}'

例5：

復(fù)制代碼代碼如下:

echo "32:34" |awk -F: '{print "max = ",max($1,$2)}\

function max(one,two){

if(one > two){

 return one;

}else{

 return two;

}

}

'

例6：

復(fù)制代碼代碼如下:

#awk 'BEGIN{print "what is your name"; getline name < "/dev/tty"}$1 ~name{print
#"found name on line" NR}END{print "see you" name}' test
#awk '{sub(/daemon/,"tankzhang");print}' test
#awk '{{sub(/zhangy/,"tankzhang");$1};print}' test

#awk '{{gsub(/zhangy/,"tankzhang");$1};print}' test
#awk -F: '{print index("zhangy",$1)}' test
#awk -F: '{print substr($1,1,2)}' test
awk -F: '{mat=match($1,/^[a-zA-Z]+$/);print mat,RSTART,RLENGTH}' test

例7：

復(fù)制代碼代碼如下:

cat test |awk -F: '\

 NF != 7{\

printf("line %d,does not have 7 fields:%s\n",NR,$0)}\

$1 !~ /^[A-Za-z0-9]/{printf("line %d,non alpha and numeric user id:%s: %s\n",NR,$1,$0)}\

$2 == "*" {printf("lind %d,no password:%s\n",NR,$0)}'

您可能感興趣的文章: