用uniq来处理文件重复数据--交集,差集,计数等(转)
2016-06-07 19:07
393 查看
经常有这样的需求:两个文本文件要求取重复的行或只取不重复的,简单的情况下用sort和uniq来处理是非常方便的:
利用现存两个文件,生成一个新的文件
取出两个文件的并集(重复的行只保留一份)
取出两个文件的交集(只留下同时存在于两个文件中的文件)
删除交集,留下其他的行
cat file1 file2 | sort | uniq
cat file1 file2 | sort | uniq -d
cat file1 file2 | sort | uniq -u
当然如果需要计数也有一个很好的参数uniq -c 可以将相同行数的计数放在行首
http://wangyufeng222.blog.163.com/blog/static/128222070201132101729867/
利用现存两个文件,生成一个新的文件
取出两个文件的并集(重复的行只保留一份)
取出两个文件的交集(只留下同时存在于两个文件中的文件)
删除交集,留下其他的行
cat file1 file2 | sort | uniq
cat file1 file2 | sort | uniq -d
cat file1 file2 | sort | uniq -u
当然如果需要计数也有一个很好的参数uniq -c 可以将相同行数的计数放在行首
http://wangyufeng222.blog.163.com/blog/static/128222070201132101729867/
相关文章推荐
- Nexus_OOS_3.xx
- 图解在8086模拟器中运行汇编helloworld程序
- 单例模式
- JMokit:mock filed还是mock parameter
- 第15周项目2:洗牌
- COGS 219.传纸条 解题报告
- UIBezierPath + CAShapeLayer的简单使用
- C# kinect V2学习笔记(六)简单的2D换衣系统
- phar打包项目压力对比测试
- java常用工具类
- SSH防止暴力破解--fail2ban
- 斜线与反斜线
- Java代码混淆(把类和变量混淆成诸如abcdefg的样子)
- Solr入门之官方文档6.0阅读笔记系列(二)
- 利用C语言中的函数实现文件的Copy
- 区块链学习笔记1
- 二分查找详解
- php5.6安装PDO_MYSQL扩展
- [线性代数]Note 1--方程组的几何解释
- Ubuntu安装g++