您的位置：首页 > 运维架构 > Linux

Linux中的awk命令中的NR何FNR的区别

2015-06-04 11:12 295 查看

awk可以使用自身变量NR和FNR来处理多个文件。

NR：表示awk开始执行程序后所读取的数据行数。

FNR：awk当前读取的记录数，其变量值小于等于NR（比如当读取第二个文件时，FNR是从0开始重新计数，而NR不会）。

NR==FNR：用于在读取两个或两个以上的文件时，判断是不是在读取第一个文件。

awk处理多个文件的基本语法是:

awk -F分隔符 'BEGIN { 初始化 } { 循环执行部分 } END { 结束处理 }' file_list1 file_list2

其中BEGIN和END可以省略，-F也可以使用默认，循环执行部分，是按行对文件进行处理的。

-------------------------------------------------

先看一下NR和FNR的使用例子。

root@ubuntu:/home/zoer# cat a

a aaaaa

b bbbbb

c ccccc

d ddddd

root@ubuntu:/home/zoer# cat b

e eeeee

f fffff

g ggggg

root@ubuntu:/home/zoer# awk '{print NR,$0}' a b

1 a aaaaa

2 b bbbbb

3 c ccccc

4 d ddddd

5 e eeeee

6 f fffff

7 g ggggg

对于NR，读取不同文件，NR是一直++的。

-------------------------------------------------

root@ubuntu:/home/zoer# awk '{print FNR,$0}' a b

1 a aaaaa

2 b bbbbb

3 c ccccc

4 d ddddd

1 e eeeee

2 f fffff

3 g ggggg

但是对于FNR，读取不同文件，开始下一个文件的时候FNR又从1开始了。

利用awk自身变量NR和FNR来处理多个文件

awk的数组跟其他程序设计语言的数组有所不同：

1、不需要正式定义，一个数组在使用时被定义；

2、数组元素的初始值为0或空字符串，除非他们被显示的指定初始化；

3、数组可以自动扩展；

4、下标可以使字符串。

NR：表示awk开始执行程序后所读取的数据行数。

FNR：awk当前读取的记录数，其变量值小于等于NR（比如当读取第二个文件时，FNR是从0开始重新计数，而NR不会）。

NR==FNR：用于在读取两个或两个以上的文件时，判断是不是在读取第一个文件。

awk处理多个文件的基本语法是:

awk -F分隔符 ‘BEGIN { 初始化 } { 循环执行部分 } END { 结束处理 }’ file_list1 file_list2

其中BEGIN和END可以省略，-F也可以使用默认，循环执行部分，是按行对文件进行处理的。

看一个例子关于NR和FNR的典型应用:

现在有两个文件格式如下：

[root@tech tmp]# cat account

李四|000002

张三|000001

王五|000003

赵六|000004

[root@tech tmp]# cat cdr

000001|10

000001|20

000002|30

000002|15

000002|45

000003|40

000003|25

000004|60

想要得到的结果是将用户名，帐号和金额在同一行打印出来,如下:

张三|000001|10

张三|000001|20

李四|000002|30

李四|000002|15

李四|000002|45

王五|000003|40

王五|000003|25

赵六|000004|60

执行如下代码

[root@tech tmp]# awk -F \| ‘NR==FNR { a[$2]=$0; next } { print a[$1]“|”$2 }’ account cdr

张三|000001|10

张三|000001|20

李四|000002|30

李四|000002|15

李四|000002|45

王五|000003|40

王五|000003|25

赵六|000004|60

我觉得这个例子很好，这是网上的解释：

当NR=FNR为真时,判断当前读入的是第一个文件account,然后使用{ a[$2]=$0; next }循环将account文件的每行记录都存入数组a,并使用$2第2个字段作为下标引用.

当NR=FNR为假时,判断当前读入了第二个文件cdr,然后跳过{a[$2]=$0;next},

对第二个文件cdr的每一行都无条件执行{ print a[$1]“|”$2 },

此时变量$1为第二个文件的第一个字段,与读入第一个文件时,

采用第一个文件第二个字段$2为数组下标相同.因此可以在此使用a[$1]引用数组。

同理可以用来对两个文件进行列合并

备注：注意数组里面的下标，如果要查询A文件中的第1列和B文件中的第2列相同的值，合并A、B文件，这里第一个文件A下标就是第1列，第二个文件B数组下标就是第2列。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航