Linux/Ubuntu中tr命令的使用及常见错误
2012-06-28 14:47
417 查看
Linux中的Shell命令:tr(translate缩写)主要用于对标准输入进行转换,压缩及删除一些字条,并打印到标准输出上。
语法:tr [–c/d/s/t] SET1 [SET2]
SET1: 字符集1
SET2:字符集2
-c, -C:complement,用SET2替换SET1中没有包含的字符
-d:delete,删除SET1中所有的字符,不转换
-s: squeeze-repeats,压缩SET1中重复的字符
-t: truncate-set1,将SET1用SET2转换,一般缺省为-t
几种常见的用法:
1、去除重复的字符
#将连续的几个相同字符压缩为一个字符
$ echo aaacccddd | tr -s [a-z]
acd
$ echo aaacccddd | tr -s [abc]
acddd
2、删除空白行
#删除空白行就是删除换行符/n
#注意:这些空白行上只有回车符,没有空格符
$ cat test.txt
I love linux!
Hello World!
Shell is worthy to been studied
#这里用换行符的转义字符\n
#注意:此处用-s删除了多余的换行符,如果用-d,则会删除所有的换行符
$ cat test.txt | tr -s ["\n"]
I love linux!
Hello World!
Shell is worthy to been studied
#也可以用八进制符\012,\012与\n都是换行符
$ cat test.txt | tr -s "[\012]"
I love linux!
Hello World!
Shell is worthy to been studied
#注意,在测试的时候,也许会发现有些“换行”没有被压缩,请确认文件里是否是因为多余的空格或者制表符引起的,比如你直接从网上复制内容到文件里就很容易产生这样的错。
#如果用-d参数,结果会像下面一样。
$ cat test.txt | tr -d ["\n"]
I love linux!Hello World!Shell is worthy to been studied$
3、大小写相互转换
#将语句中所有的小写字母变成大写字母,其中-t可省略
$ echo "Hello World I Love You" |tr [-t] [a-z] [A-Z]
HELLO WORLD I LOVE YOU
#将语句中所有的大写字母变成小写字母
$ echo "Hello World I Love You" |tr [A-Z] [a-z]
hello world i love you
#也可以利用字符类进行转换
#[:lower:]代表小写字母,[:upper:]代表大写字母
$ echo "Hello World I Love You" | tr [:lower:] [:upper:]
HELLO WORLD I LOVE YOU
#注意:在SHELL脚本里,有时候会用到“tr [:lower:] [:upper:]”来实现大小写转换的功能,但是如果在运行脚本的当前目录里有以一个字符命名的文件存在,比如"l", "o", "w", "u", or "p",这时候SHELL脚本会报以下的错:“tr:
misaligned [:upper:] and/or [:lower:] construct”或者“tr: extra operand `o'”(o为文件的名字), 这个可能是当前SHELL的tr命令的一个BUG,也可能是他们不推荐这样使用吧。比如,我有如下的脚本:
$ cat install_sh.sh
#!/bin/bash
SCNAME=`echo $2 | tr [:upper:] [:lower:]`;
echo $2;
echo $SCNAME;
在运行的时候并没有什么错:
$
./install_sh.sh aaa XtttX
XtttX
xtttx
但是,如果我在当前的目录里加一个文件,命名为“u”,再运行这个脚本的时候就会报如下的错:
$ ./install_sh.sh aaa XtttX
tr: misaligned [:upper:] and/or [:lower:] construct
XtttX
针对这种错误的解决方案是:
1. 对[:lower:]和[:upper:]加双引号,比如:tr "[:lower:]" "[:upper:]".
2. 用[a-z] [A-Z]代替[:lower:] [:upper:],因为这个就是实现大小写字符的转换,而且[a-z]代表所有的小写字符,[A-Z]代表所有的大写字符。
除了[:lower:] [:upper:],[:alpha:]好像也存在同样的问题。
针对这个问题可以参考:http://www-01.ibm.com/support/docview.wss?uid=swg1PJ31922
4、删除指定的字符
$ cat test.txt
Monday 09:00
Tuesday 09:10
Wednesday 10:11
Thursday 11:30
Friday 08:00
Saturday 07:40
Sunday 10:00
#现在要删除处理星期之外的所有字符
#-d代表删除,[0-9]代表所有的数字,[: ]代表冒号和空格
$ cat test.txt | tr -d "[0-9][: ]"
Monday
Tuesday
Wednesday
Thursday
Friday
Saturday
Sunday
5、利用-c进行补集的替换
#有时候在文本中我们只知道要保留的一些字符,其他字符种类繁多,就可以使用补集的替换
$ cat test.txt
Monday 09:00
Tuesday 09:10
Wednesday 10:11
Thursday 11:30
Friday 08:00
Saturday 07:40
Sunday 10:00
#我们只需要星期,则思路就是除了字母,其他统统替换掉
#这里,-c:用换行符替换掉除了字母外的所有字符;-s:删除多余的换行符
cat test.txt|tr -cs "[a-z][A-Z]" "\n"
Monday
Tuesday
Wednesday
Thursday
Friday
Saturday
Sunday
6. 其它的一些特殊字符集。
[:alnum:] all letters and digits
[:alpha:] all letters
[:blank:] all horizontal whitespace
[:cntrl:] all control characters
[:digit:] all digits
[:graph:] all printable characters, not including space
[:lower:] all lower case letters
[:print:] all printable characters, including space
[:punct:] all punctuation characters
[:space:] all horizontal or vertical whitespace
[:upper:] all upper case letters
[:xdigit:] all hexadecimal digits
[=CHAR=] all characters which are equivalent to CHAR
总结:其中大小写字母的转换,删除不需要的字符比较常用。tr语法简单,易用。
tr的其它文档参考:
http://www.2cto.com/os/201109/104590.html
http://blog.csdn.net/junmail/article/details/4821948
http://hi.baidu.com/boyshen/blog/item/35dd6b25cb29d527d507426e.html
9e67
http://www.book118.com/read/a/Linux%B3%A3%D3%C3%C3%FC%C1%EE%C8%AB%BC%AF/%CE%C4%B5%B5%B1%E0%BC%AD/tr.html
语法:tr [–c/d/s/t] SET1 [SET2]
SET1: 字符集1
SET2:字符集2
-c, -C:complement,用SET2替换SET1中没有包含的字符
-d:delete,删除SET1中所有的字符,不转换
-s: squeeze-repeats,压缩SET1中重复的字符
-t: truncate-set1,将SET1用SET2转换,一般缺省为-t
几种常见的用法:
1、去除重复的字符
#将连续的几个相同字符压缩为一个字符
$ echo aaacccddd | tr -s [a-z]
acd
$ echo aaacccddd | tr -s [abc]
acddd
2、删除空白行
#删除空白行就是删除换行符/n
#注意:这些空白行上只有回车符,没有空格符
$ cat test.txt
I love linux!
Hello World!
Shell is worthy to been studied
#这里用换行符的转义字符\n
#注意:此处用-s删除了多余的换行符,如果用-d,则会删除所有的换行符
$ cat test.txt | tr -s ["\n"]
I love linux!
Hello World!
Shell is worthy to been studied
#也可以用八进制符\012,\012与\n都是换行符
$ cat test.txt | tr -s "[\012]"
I love linux!
Hello World!
Shell is worthy to been studied
#注意,在测试的时候,也许会发现有些“换行”没有被压缩,请确认文件里是否是因为多余的空格或者制表符引起的,比如你直接从网上复制内容到文件里就很容易产生这样的错。
#如果用-d参数,结果会像下面一样。
$ cat test.txt | tr -d ["\n"]
I love linux!Hello World!Shell is worthy to been studied$
3、大小写相互转换
#将语句中所有的小写字母变成大写字母,其中-t可省略
$ echo "Hello World I Love You" |tr [-t] [a-z] [A-Z]
HELLO WORLD I LOVE YOU
#将语句中所有的大写字母变成小写字母
$ echo "Hello World I Love You" |tr [A-Z] [a-z]
hello world i love you
#也可以利用字符类进行转换
#[:lower:]代表小写字母,[:upper:]代表大写字母
$ echo "Hello World I Love You" | tr [:lower:] [:upper:]
HELLO WORLD I LOVE YOU
#注意:在SHELL脚本里,有时候会用到“tr [:lower:] [:upper:]”来实现大小写转换的功能,但是如果在运行脚本的当前目录里有以一个字符命名的文件存在,比如"l", "o", "w", "u", or "p",这时候SHELL脚本会报以下的错:“tr:
misaligned [:upper:] and/or [:lower:] construct”或者“tr: extra operand `o'”(o为文件的名字), 这个可能是当前SHELL的tr命令的一个BUG,也可能是他们不推荐这样使用吧。比如,我有如下的脚本:
$ cat install_sh.sh
#!/bin/bash
SCNAME=`echo $2 | tr [:upper:] [:lower:]`;
echo $2;
echo $SCNAME;
在运行的时候并没有什么错:
$
./install_sh.sh aaa XtttX
XtttX
xtttx
但是,如果我在当前的目录里加一个文件,命名为“u”,再运行这个脚本的时候就会报如下的错:
$ ./install_sh.sh aaa XtttX
tr: misaligned [:upper:] and/or [:lower:] construct
XtttX
针对这种错误的解决方案是:
1. 对[:lower:]和[:upper:]加双引号,比如:tr "[:lower:]" "[:upper:]".
2. 用[a-z] [A-Z]代替[:lower:] [:upper:],因为这个就是实现大小写字符的转换,而且[a-z]代表所有的小写字符,[A-Z]代表所有的大写字符。
除了[:lower:] [:upper:],[:alpha:]好像也存在同样的问题。
针对这个问题可以参考:http://www-01.ibm.com/support/docview.wss?uid=swg1PJ31922
4、删除指定的字符
$ cat test.txt
Monday 09:00
Tuesday 09:10
Wednesday 10:11
Thursday 11:30
Friday 08:00
Saturday 07:40
Sunday 10:00
#现在要删除处理星期之外的所有字符
#-d代表删除,[0-9]代表所有的数字,[: ]代表冒号和空格
$ cat test.txt | tr -d "[0-9][: ]"
Monday
Tuesday
Wednesday
Thursday
Friday
Saturday
Sunday
5、利用-c进行补集的替换
#有时候在文本中我们只知道要保留的一些字符,其他字符种类繁多,就可以使用补集的替换
$ cat test.txt
Monday 09:00
Tuesday 09:10
Wednesday 10:11
Thursday 11:30
Friday 08:00
Saturday 07:40
Sunday 10:00
#我们只需要星期,则思路就是除了字母,其他统统替换掉
#这里,-c:用换行符替换掉除了字母外的所有字符;-s:删除多余的换行符
cat test.txt|tr -cs "[a-z][A-Z]" "\n"
Monday
Tuesday
Wednesday
Thursday
Friday
Saturday
Sunday
6. 其它的一些特殊字符集。
[:alnum:] all letters and digits
[:alpha:] all letters
[:blank:] all horizontal whitespace
[:cntrl:] all control characters
[:digit:] all digits
[:graph:] all printable characters, not including space
[:lower:] all lower case letters
[:print:] all printable characters, including space
[:punct:] all punctuation characters
[:space:] all horizontal or vertical whitespace
[:upper:] all upper case letters
[:xdigit:] all hexadecimal digits
[=CHAR=] all characters which are equivalent to CHAR
总结:其中大小写字母的转换,删除不需要的字符比较常用。tr语法简单,易用。
tr的其它文档参考:
http://www.2cto.com/os/201109/104590.html
http://blog.csdn.net/junmail/article/details/4821948
http://hi.baidu.com/boyshen/blog/item/35dd6b25cb29d527d507426e.html
9e67
http://www.book118.com/read/a/Linux%B3%A3%D3%C3%C3%FC%C1%EE%C8%AB%BC%AF/%CE%C4%B5%B5%B1%E0%BC%AD/tr.html
相关文章推荐
- Linux中使用curl命令访问https站点4种常见错误和解决方法
- Linux中使用curl命令访问https站点4种常见错误和解决方法
- linux使用过程中的常见错误
- Linux Touch命令的8种常见使用方法
- Linux常见命令使用
- Linux/Ubuntu sudo命令详解使用格式和方法
- linux 中环境变量配置错误导致部分命令不能使用包括vi
- 使用配置hadoop中常用的Linux(ubuntu)命令
- linux ubuntu centos wget手册 wget命令使用方法
- 常见linux问题解决办法和ubuntu使用中遇到问题
- Linux常见命令--SCP命令的使用
- Ubuntu(Linux)使用alt+c关闭显示器命令
- linux service命令常见使用方法
- Linux 修改系统变量错误大致基础命令不能使用问题修复!
- Linux ubuntu下svn的命令使用指南
- linux service命令常见使用方法
- Linux常见命令的使用
- sudo命令:解决使用Linux命令行时出现的错误提示
- svn(subversion)代码版本管理在linux下的一些常见使用命令
- linux同步时间错误 使用 ntpdate命令