您的位置：首页 > 运维架构 > Linux

Linux与生物信息（第一章——Linux常用命令2）

2017-05-26 15:17 204 查看

（网易云课堂，腾讯课堂生物信息讲师，高级生物信息工程师）

1.3 压缩解压缩

1.3.1 tar

功能说明：加入或还原备份文件内的文件

语法：tar
-f[cxzjv] <file>

参数：-f 必加参数

-c 创建备份文件

-x 从备份文件中还原文件

-z 调用gzip/gunzip来压缩/解压缩文件

-j 调用bzip2/bunzip2来压缩/解压缩文件

-v 显示命令执行过程

Example ：tar
-cf newfile.tar file1 file2 将file1，file2文件打包到newfile.tar

tar -xf newfile.tar 提取newfile.tar中的文件

tar -czvf newfile.tar.gz file1 file2 将file1，file2文件打包并调用gzip程序将文件压缩为 newfile.tar.gz

tar -xzvf newfile.tar.gz 将newfile.tar.gz文件解压并提取里边的文件

1.3.2 zip

功能说明：压缩并生成“.zip”结尾的文件

语法：zip
[-1..9][-r] <newfile.zip> <sourcefile/dir>

参数：-r 将子目录下所有文件和目录一并处理

-1..9 压缩效率，数值越大，压缩效率越高

Example ：zipnewfile.zip
file1 file2 将file1，file2进行压缩到newfile.zip内

解压方式：使用unzip进行解压，unzip
newfile.zip

1.3.3 gzip

功能说明：压缩并生成“.gz”结尾的文件

语法：gzip
[-1..9][-r] <file/dirname>

参数：-r 对目录下的文件进行压缩，但不会对目录进行压缩

-1..9 压缩效率，数值越大，压缩效率越高（默认6）

Example ：gzip
file 将file压缩为file.gz并删除源文件

解压方式：使用gunzip进行解压，gunzip
file.gz

1.3.4 bzip2

功能说明：压缩并生成“.bz2”结尾的文件

语法：bzip2
<file>

Example ：bzip2
file 将file压缩为file.bz2并删除源文件

解压方式：使用bunzip2进行解压，bunzip2file.bz2

1.4数据统计与处理

1.4.1 sort

功能说明：将文本文件内容进行排序

语法：sort
[-nkr]<filename>

参数：-n/-g 将文件按数值大小从小到大排序（默认按ascii码从小到大排序）

-k <num> 按第num列内容对文件排序（默认按第一列）

-r 反向排序

Example ：sort
file 对file文件按第一列内容ascii码值从小到大排序并输出。

sort -n -k 3 file 对file文件按第3列内容数值大小从小到大排序。

sort -nr -k1,2 file 对file文件按数值大小反向排序，优先考虑第一列，再考虑第二列

1.4.2 uniq

功能说明：合并文件中相邻的相同的行

语法：uniq
[-cd] <file> [outfile]

参数：-c 在每行第一列显示该行重复次数

-d 仅显示有重复的行

Example ：uniq
-c file 合并相同的行，并统计每行重复次数，输出到屏幕

uniq -d file outfile 合并相同的行，并显示file中有重复出现的行，输出到outfile文件中

1.4.3 wc（word count）

功能说明：统计文件中字节数

语法：wc
[-cwl] <file>

参数：-c 只统计字节数/Bytes数

-w 只统计字数（单词数）

-l 只统计行数

Example ：wcfile 显示文件file的字节数，字数，行数

wc -l file 显示文件file的行数

1.4.4 grep

功能说明：查找文件中符合条件的行

语法：grep
[-v] <string> <file>

参数：-v 不匹配，显示文件中不匹配string的行

Example ：grep
world file 查找文件中含有“world”的行

grep -v world file 查找文件中不含有“world”的行

1.4.5 awk

功能说明：对特定的行中特定的列进行操作

语法：awk
[-F] ‘(condition){operate}’ <filename>

参数：-F 指定列的分割符，可以使任意字符，默认按空白分割

Example ：awk
-F “:” ‘{print $1}’ 按“：”来分割并打印出第一列

awk ‘($1 > 100){print $0}’ 对第一列大于100的行整行输出

awk ‘($1 > 100){print $1”\t”$2}’ 对第一列大于100的行输出第一列和第二列的结果并以“\t”分割。

awk ‘($3~/world/){ x+= $1}END{print x}’ 对第三列匹配“world”的行的第一列求和，全部处理完之后输

出结果x的值

1.4.6 sed

功能说明：文本处理并可对文件进行编辑

语法：sed
[-i] '{command}' <filename>

参数：-i 直接在原文件中修改（默认修改后屏幕输出，原文件不变）

Example ：sed
-i ‘s/test/new_word/’ file 将file文件中的test字符替换为new_word

sed -i ‘/pattern/ s/ test/new_word/’ file 将file文件中匹配pattern字串的行进行替换操作

sed -i ‘/^$/ d’ file 将文件file中的空白行删除（d）

1.5.1 md5sum

功能说明：验证文件传输的完整性

语法：md5sum
[-c] <filename>

参数：-c 校验文件传输后是否完整

Example ：md5sumfile1 对file1文件生成md5值。

md5sum file1 > newfile 对file1文件生成md5值并重定向到newfile中。

md5sum -c newfile 检验newfile中文件的md5值是否和文件一致。

1.5.2 chmod

功能说明：设置文件或目录权限

语法：chmod
[-R] <mode> <file/dirname>

参数：-R 对目录和目录下所有文件均设置权限

详细说明：文件权限分为是否可读(r)、是否可写(w)、是否可执行(x)3种，同时对应档案拥有者(u)、同组成员(g)、其

他成员(o)3种。mode分为符号模式和数值模式。

符号模式：[ugoa] [+-=] [rwx]

数值模式：用1/0表示，则111表示可读可写可执行，000表示不可读不可写不可执行，可读可写可执行

分别对应10进制的4,2,1，则5表示可读不可写可执行。

Example ：chmod
u+xg=rx o-rwx file 对file 文件用户自身增加可执行权限，同组成员权限设置为可读可写，

对其他成员移除rwx权限。

chmod a-w file 对file文件所有成员移除可写权限。

chmod -R 750 dirname 对dirname目录及其下所有文件权限设置为用户自身可读可写可执行，同组

成员可读可执行，其他成员无权限。

1.5.3 find

功能说明：查找文件

语法：find
[path] [expression]

详细说明：path 在path路径下进行查找

expression 查找模式，常用的有

-name <filename> 按文件名查找（文件名允许通配符）

-perm <mode> 按文件权限查找

-user <user name> 按文件所有者查找

-group <group name> 按文件所在组查找

-mtime <+n/-n> 按文件更改时间查找，-n表示更改时间距现在n天以内，+n表示距现

在n天以外

-type <l/d/f> 按文件类型查找，l：符号链接文件，f：普通文件，d：目录文件

Example ：find./
-name file 在当前目录及其子目录下查找文件名为file的文件

find ./ -name ‘*a’ -type d 寻找文件名以a结尾的目录文件。

1.5.4 du

功能说明：显示目录或文件的大小

语法：du
[-ash] [--max-depth=<n>] <file/dirname>

参数：-a 显示目录中个别文件大小

-s 只显示总计

-h 以“K” ，“M” ，“G”为单位显示

--max-depth=<n> 只显示n层目录以内的文件

Example ：du
-sh ./ 显示当前目录的大小

du -ah --max-depth=1 dir 显示dir目录下所有文件大小，不包括下一级目录

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航