您的位置:首页 > 大数据 > 人工智能

AIX下sort命令简介及使用

2012-12-11 21:51 441 查看
sort命令将许多不同的域按不同的列顺序排序,sort命令如下:
sort -cmu -o output_file [other options] +pos1 +pos2 input_files
-c:测试文件是否已经排序
-m:合并两个排序文件
-u:删除所有重复行
-o:存储sort结果的输出文件名
其他选项:
-b:使用域进行排序时,忽略第一个空格
-n:指定排序是域上的数字排序
-t:域分隔符,用非空格或tab键分隔域
-r:反序或者逆序
+n:n为域号,使用此域号开始排序
n:n为域号,在排序比较时忽略次域,一般与+n一起使用
pos1:传递到m,n;m为域号,n为开始排序字符数;
例如4,6为第5个域,从第7个字符开始

域分隔符:默认情况下,sort认为一个空格或一系列空格为分隔符;
排序键,第一个域就是排序键1,第二个域就是排序键2,依次类推。
排序的时候,先按排序键1排序,接着按照排序键2排序,依次类推。
排序的时候,每个域中按照字符或者数字或者符号的ASCII码进行比较,空格的ASCII为32。
按照数值域进行分类,在域号后面加n。
文件video.txt
pg video.txt
Boys in Company C:HK:192:2192
Alien:HK:119:1982
The Hill:KL:63:2972
Aliens:HK:532:4892
Star Wars:HK:301:4102
A Few Good Men:KL:445:5851
Toy Story:HK:239:3972
A google:HK
其中“:”为域分隔符号,下面使用"-t:"标识相连的域之间以":"分隔。
正序排列:
pg video.txt
Boys in Company C:HK:192:2192
Alien:HK:119:1982
The Hill:KL:63:2972
Aliens:HK:532:4892
Star Wars:HK:301:4102
A Few Good Men:KL:445:5851
Toy Story:HK:239:3972
A google:HK

逆序排列:
sort -t: -r video.txt
Toy Story:HK:239:3972
The Hill:KL:63:2972
Star Wars:HK:301:4102
Boys in Company C:HK:192:2192
Aliens:HK:532:4892
Alien:HK:119:1982
A google:HK
A Few Good Men:KL:445:5851

按指定域排列
第一个域:
sort -t: +1 video.txt
A google:HK
Alien:HK:119:1982
Boys in Company C:HK:192:2192
Toy Story:HK:239:3972
Star Wars:HK:301:4102
Aliens:HK:532:4892		①
A Few Good Men:KL:445:5851	②
The Hill:KL:63:2972
第二个域:
sort -t: +2 video.txt
A google:HK
Alien:HK:119:1982
Boys in Company C:HK:192:2192
Toy Story:HK:239:3972
Star Wars:HK:301:4102
A Few Good Men:KL:445:5851	②
Aliens:HK:532:4892		①
The Hill:KL:63:2972
第三个域:
sort -t: +3n video.txt
A google:HK
Alien:HK:119:1982
Boys in Company C:HK:192:2192
The Hill:KL:63:2972
Toy Story:HK:239:3972
Star Wars:HK:301:4102
Aliens:HK:532:4892
A Few Good Men:KL:445:5851

去除重复的行,我们先给文件增加重复的行:
pg video.txt
Boys in Company C:HK:192:2192
...
A google:HK
A google:HK
使用-u选项去除重复的行:
sort -u video.txt
A Few Good Men:KL:445:5851
A google:HK
Alien:HK:119:1982
Aliens:HK:532:4892
Boys in Company C:HK:192:2192
Star Wars:HK:301:4102
The Hill:KL:63:2972
Toy Story:HK:239:3972

使用k做键值排序,按顺序给域编号,第一个域为k1,第二个域为k2,依次类推。
先按照第4个域排序,在按照第1个域进行排序
sort -t: -r -k4 -k1 video.txt
A Few Good Men:KL:445:5851
Aliens:HK:532:4892
Star Wars:HK:301:4102
Toy Story:HK:239:3972
The Hill:KL:63:2972
Boys in Company C:HK:192:2192
Alien:HK:119:1982	①
A google:HK:301:1982	②
A google:HK

pos的用法:指定域中字母的位置。
格式:sort +field_number.characters_in
意思:从field_number的第characters_in个字符开始排序
例如:
Field0	Field1	Field2	Field3
Aliens	H K 1 L	532	4892
0 1 2 3
sort -t: +1.2 video.txt
Aliens:HK1l:532:4892
A google:HK10:301:1982
The Hill:KL23:63:2972
Star Wars:HK38:301:4102
Boys in Company C:HK48:192:2192
Alien:HK57:119:1982
Toy Story:HK65:239:3972
A Few Good Men:KL87:445:5851
域标识从0开始,第一个域的下标为0,类似c语言中的数组下标从0开始。

从第一个域的第二个字符开始排序:
sort -t: +0.1 video.txt
A Few Good Men:KL87:445:5851
A google:HK10:301:1982
The Hill:KL23:63:2972
Alien:HK57:119:1982
Aliens:HK1l:532:4892
Toy Story:HK65:239:3972
Boys in Company C:HK48:192:2192
Star Wars:HK38:301:4102

显示排序后的开始几行或者最后几行
按第4个域进行排序,然后显示前2行:
sort -t: -k4 video.txt | head -2
A google:HK10:301:1982
Alien:HK57:119:1982

从第1个域的第三个字符开始排序,查看最后1行数据:
sort -t: +0.2 video.txt |tail -1
Boys in Company C:HK48:192:2192

另外,通过head和tail命令还可以查看文件的头或者尾部一行或多行数据。
pg video.txt
Boys in Company C:HK48:192:2192
Alien:HK57:119:1982
The Hill:KL23:63:2972
Aliens:HK1l:532:4892
Star Wars:HK38:301:4102
A Few Good Men:KL87:445:5851
Toy Story:HK65:239:3972
A google:HK10:301:1982
1.查看video.txt文件的头3行:
head -3 video.txt
Boys in Company C:HK48:192:2192
Alien:HK57:119:1982
The Hill:KL23:63:2972
2.查看video.txt文件的最后2行:
tail -2 video.txt
Toy Story:HK65:239:3972
A google:HK10:301:1982
3.head和tail命令,若没指定显示行的话,默认显示10行。

结合awk命令使用:
sort -t: -k4 video.txt | tail -1 | awk -F: '{print "The highest is " $4}'
The highest is 5851

使用-m将两个文件合并,格式:sort -m file1 file2
pg video2.txt
Crimson Tide:134:2031
Die Hard:152:2981

pg video.txt
Boys in Company C:HK48:192:2192
Alien:HK57:119:1982
The Hill:KL23:63:2972
Aliens:HK1l:532:4892
Star Wars:HK38:301:4102
A Few Good Men:KL87:445:5851
Toy Story:HK65:239:3972
A google:HK10:301:1982

合并:sort -t: -m video2.txt video.txt
Boys in Company C:HK48:192:2192
Alien:HK57:119:1982
Crimson Tide:134:2031	①
Die Hard:152:2981	②
The Hill:KL23:63:2972
Aliens:HK1l:532:4892
Star Wars:HK38:301:4102
A Few Good Men:KL87:445:5851
Toy Story:HK65:239:3972
A google:HK10:301:1982

查看磁盘信息,并按照第四个域排序
df | sort +4
/dev/boot                30720    10693     20027      35% /stand
/dev/root             72986472 48856763  24129709      67% /
Filesystem         1024-blocks     Used Available Capacity Mounted on

下面IP地址中,对IP进行排序。
pg iplist
191.168.1.55    Scott
191.168.2.36    Tim Cook
191.168.2.56    Davaid
191.168.1.80    Albert
191.168.1.20    Thomas
191.168.2.155   _yeeXun
191.168.2.253   J.Wong
下面对ip地址进行排序,以"."作为分隔符,分隔出4个域;
先按照第3个域排序,再按照第4个域进行排序,
注意:数字域0表示第一个域,后跟着字母"n"。
sort -t. +2n +3n iplist
191.168.1.20    Thomas
191.168.1.55    Scott
191.168.1.80    Albert
191.168.2.155   _yeeXun
191.168.2.253   J.Wong
191.168.2.36    Tim Cook
191.168.2.56    Davaid
--the end--
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: