您的位置:首页 > 运维架构 > Linux

linux sort, uniq, cut, wc, xargs和管道'|'区别,expect自动化脚本

2016-01-07 11:26 369 查看

sort

sort命令对File参数指定的文件中的行排序,并将结果写到标准输出。如果File参数指定多个文件,那么sort命令将这些文件连接起来,并当作一个文件进行排序。

sort语法

[root@www~]#sort[-fbMnrtuk][fileorstdin]
选项与参数:
-f:忽略大小写的差异,例如A与a视为编码相同;
-b:忽略最前面的空格符部分;
-M:以月份的名字来排序,例如JAN,DEC等等的排序方法;
-n:使用『纯数字』进行排序(默认是以文字型态来排序的);
-r:反向排序;
-u:就是uniq,相同的数据中,仅出现一行代表;
-t:分隔符,默认是用[tab]键来分隔;
-k:以那个区间(field)来进行排序的意思


对/etc/passwd的账号进行排序


[root@www~]#cat/etc/passwd|sort
adm:x:3:4:adm:/var/adm:/sbin/nologin
apache:x:48:48:Apache:/var/www:/sbin/nologin
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin


sort是默认以第一个数据来排序,而且默认是以字符串形式来排序,所以由字母a开始升序排序。

/etc/passwd内容是以:来分隔的,我想以第三栏来排序,该如何

[root@www~]#cat/etc/passwd|sort-t':'-k3
root:x:0:0:root:/root:/bin/bash
uucp:x:10:14:uucp:/var/spool/uucp:/sbin/nologin
operator:x:11:0:operator:/root:/sbin/nologin
bin:x:1:1:bin:/bin:/sbin/nologin
games:x:12:100:games:/usr/games:/sbin/nologin


默认是以字符串来排序的,如果想要使用数字排序:

cat/etc/passwd|sort-t':'-k3n
root:x:0:0:root:/root:/bin/bash
daemon:x:1:1:daemon:/usr/sbin:/bin/sh
bin:x:2:2:bin:/bin:/bin/sh


默认是升序排序,如果要倒序排序,如下

cat/etc/passwd|sort-t':'-k3nr
nobody:x:65534:65534:nobody:/nonexistent:/bin/sh
ntp:x:106:113::/home/ntp:/bin/false
messagebus:x:105:109::/var/run/dbus:/bin/false
sshd:x:104:65534::/var/run/sshd:/usr/sbin/nologin


如果要对/etc/passwd,先以第六个域的第2个字符到第4个字符进行正向排序,再基于第一个域进行反向排序。

cat/etc/passwd|sort-t':'-k6.2,6.4-k1r
sync:x:4:65534:sync:/bin:/bin/sync
proxy:x:13:13:proxy:/bin:/bin/sh
bin:x:2:2:bin:/bin:/bin/sh
sys:x:3:3:sys:/dev:/bin/sh


查看/etc/passwd有多少个shell:对/etc/passwd的第七个域进行排序,然后去重:

cat/etc/passwd|sort-t':'-k7-u
root:x:0:0:root:/root:/bin/bash
syslog:x:101:102::/home/syslog:/bin/false
daemon:x:1:1:daemon:/usr/sbin:/bin/sh
sync:x:4:65534:sync:/bin:/bin/sync
sshd:x:104:65534::/var/run/sshd:/usr/sbin/nologin


uniq

uniq命令可以去除排序过的文件中的重复行,因此uniq经常和sort合用。也就是说,为了使uniq起作用,所有的重复行必须是相邻的。

uniq语法

[root@www~]#uniq[-icu]
选项与参数:
-i:忽略大小写字符的不同;
-c:进行计数
-u:只显示唯一的行


testfile的内容如下

cattestfile
hello
world
friend
hello
world
hello


直接删除未经排序的文件,将会发现没有任何行被删除

#uniqtestfile
hello
world
friend
hello
world
hello


排序文件,默认是去重

#catwords|sort|uniq
friend
hello
world


排序之后删除了重复行,同时在行首位置输出该行重复的次数

#sorttestfile|uniq-c
1friend
3hello
2world


仅显示存在重复的行,并在行首显示该行重复的次数

#sorttestfile|uniq-dc
3hello
2world


仅显示不重复的行

sorttestfile|uniq-u
friend


cut

cut命令可以从一个文本文件或者文本流中提取文本列。

cut语法

[root@www~]#cut-d'分隔字符'-ffields<==用于有特定分隔字符
[root@www~]#cut-c字符区间<==用于排列整齐的信息
选项与参数:
-d:后面接分隔字符。与-f一起使用;
-f:依据-d的分隔字符将一段信息分割成为数段,用-f取出第几段的意思;
-c:以字符(characters)的单位取出固定字符区间;


PATH变量如下

[root@www~]#echo$PATH
/bin:/usr/bin:/sbin:/usr/sbin:/usr/local/bin:/usr/X11R6/bin:/usr/games
#1|2|3|4|5|6|7


将PATH变量取出,我要找出第五个路径。

#echo$PATH|cut-d':'-f5
/usr/local/bin


将PATH变量取出,我要找出第三和第五个路径。

#echo$PATH|cut-d':'-f3,5
/sbin:/usr/local/bin


将PATH变量取出,我要找出第三到最后一个路径。

echo$PATH|cut-d':'-f3-

/sbin:/usr/sbin:/usr/local/bin:/usr/X11R6/bin:/usr/games


将PATH变量取出,我要找出第一到第三个路径。

#echo$PATH|cut-d':'-f1-3

/bin:/usr/bin:/sbin:



将PATH变量取出,我要找出第一到第三,还有第五个路径。

echo$PATH|cut-d':'-f1-3,5

/bin:/usr/bin:/sbin:/usr/local/bin


实用例子:只显示/etc/passwd的用户和shell

#cat/etc/passwd|cut-d':'-f1,7
root:/bin/bash
daemon:/bin/sh
bin:/bin/sh


wc

统计文件里面有多少单词,多少行,多少字符。

wc语法

[root@www~]#wc[-lwm]
选项与参数:
-l:仅列出行;
-w:仅列出多少字(英文单字);
-m:多少字符;


默认使用wc统计/etc/passwd

#wc/etc/passwd
40451719/etc/passwd


40是行数,45是单词数,1719是字节数

wc的命令比较简单使用,每个参数使用如下:

#wc-l/etc/passwd#统计行数,在对记录数时,很常用
40/etc/passwd#表示系统有40个账户

#wc-w/etc/passwd#统计单词出现次数
45/etc/passwd

#wc-m/etc/passwd#统计文件的字节数
1719


xargs和管道|区别

一直弄不懂,管道不就是把前一个命令的结果作为参数给下一个命令吗,那在|后面加不加xargs有什么区别

NewUserFF写道:

懒蜗牛Gentoo写道:

管道是实现“将前面的标准输出作为后面的标准输入”

xargs是实现“将标准输入作为命令的参数”

你可以试试运行:

代码:

echo"--help"|cat

echo"--help"|xargscat

看看结果的不同。

试过了,依然不是很确定的明白到底是什么意思,自己再探索一下看看把

如果你直接在命令行输入cat而不输入其余的任何东西,这时候的cat会等待标准输入,因此你这时候可以

通过键盘输入并按回车来让cat读取输入,cat会原样返回。而如果你输入--help,那么cat程序会在标准输出上

打印自己的帮助文档。也就是说,管道符|所传递给程序的不是你简单地在程序名后面输入的参数,它们会被

程序内部的读取功能如scanf和gets等接收,而xargs则是将内容作为普通的参数传递给程序,相当于你手写了

cat--help

来自:http://forum.ubuntu.org.cn/viewtopic.php?t=354669

补充解释:

在一个目录中有如下三个文件

a.cb.cc.c

find./-print命令会打印出三个文件名

find./-print|grepa.c只会打印出a.c这个文件

如果只输入命令grepa.c

那么你在键盘中只输入a.c字符串时,a.c会被打印两次,否则只打印你输入的字符

如果要找三个文件中,那个文件包括有hello字符

find./-print|xargsgrephello

总结:管道符后不加xargs相当于先将xargs后面的命令回车执行一下再从键盘里输入

管道符前面命令执行的结果内容

加上xargs相当于直接从键盘输入管道符前面命令执行的结果内容再回车

再总结一下,就是回车的先后顺序不太一样。

执行sudo/ssh登录时自动输入密码

自己的实验脚本:

#!/usr/bin/expect

settimeout30

spawnsudols-l

expect"passwordforcl:"

send"password\r"

interact

本文用一个最短的例子说明脚本的原理。

  脚本代码如下:

  ##############################################

  #!/usr/bin/expect

  settimeout30

  spawnssh-lusername192.168.1.1

  expect"password:"

  send"ispass\r"

  interact

  ##############################################

  1.[#!/usr/bin/expect]

  这一行告诉操作系统脚本里的代码使用那一个shell来执行。这里的expect其实和linux下的bash、windows下的cmd是一类东西。

  注意:这一行需要在脚本的第一行。

  2.[settimeout30]

  基本上认识英文的都知道这是设置超时时间的,现在你只要记住他的计时单位是:秒

  3.[spawnssh-lusername192.168.1.1]

  spawn是进入expect环境后才可以执行的expect内部命令,如果没有装expect或者直接在默认的SHELL下执行是找不到spawn命令的。所以不要用“whichspawn“之类的命令去找spawn命令。好比windows里的dir就是一个内部命令,这个命令由shell自带,你无法找到一个dir.com或dir.exe的可执行文件。

  它主要的功能是给ssh运行进程加个壳,用来传递交互指令。

  4.[expect"password:"]

  这里的expect也是expect的一个内部命令,有点晕吧,expect的shell命令和内部命令是一样的,但不是一个功能,习惯就好了。这个命令的意思是判断上次输出结果里是否包含“password:”的字符串,如果有则立即返回,否则就等待一段时间后返回,这里等待时长就是前面设置的30秒

  5.[send"ispass\r"]

  这里就是执行交互动作,与手工输入密码的动作等效。

  温馨提示:命令字符串结尾别忘记加上“\r”,如果出现异常等待的状态可以核查一下。

  6.[interact]

  执行完成后保持交互状态,把控制权交给控制台,这个时候就可以手工操作了。如果没有这一句登录完成后会退出,而不是留在远程终端上。如果你只是登录过去执行

  #!/usr/bin/expect#注意安装的路径,不确定whereisexpect一下

  #Changealoginshelltobash

  setuser[lindex$argv0]

  spawnbash$user

  expect"]:"

  send"/bin/bash"

  expecteof

  exit
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: