[转]处理文件CRLF line terminators的问题
2013-12-30 20:40
148 查看
[转]处理文件CRLF line terminators的问题
2012-08-09 17:01:43| 分类: linux|字号 订阅今天在处理一个文件的时候发现无法实现
我的操作如下
grep -E "*beta$" fileA
大概就是抽取每行以beta为结尾。 但是在抽取的时候发现如何都得不到结果
尝试以awk来操作 awk '{if($0~/beta$/) print $0}' file A
也得不到结果
最后我将文本的内容拷贝到另外一个文件里。 用同样的方法来操作。 可以得到完整的结果。
于是考虑是否是文件的问题。
因为这个文件是我从windows下编辑然后拷贝到服务器上的。于是file文件的时候发现
fileA: ASCII text, with CRLF line terminators
然后查看自己复制文本生成的文件
fileB: ASCII text
其中with CRLF line terminators 应该是windows生成文件时的不同。
估计是windows传过来的时候因为格式的问题在文本中有隐藏的字符。所以在查询结尾的时候无法得到结果。
dos2unix fileA
grep -E "*beta$" fileA
OK 解决
----------------------以下是转的 我的参考------------------------------------
今天协助研发去处理一份文件对比的事情,就是对比file1.log和file2.log中相同重复的行。
发现很容易实现,直接:
$ for i in `cat file1.log`; do grep $i ./file2.log; done > sameline.log
结果就发现只有一条,研发的同学说至少有上万条记录,我开始找原因:
先输出测试看看格式什么的对不对:
$ for i in `cat file1.log`; do echo "AAA"$i"BBB"; done
BBBxxxxxxxxxxx05_ok
BBBxxxxxxxxxxx06_ok
BBBxxxxxxxxxxx07_ok
BBBxxxxxxxxxxx08_ok
调试一下,发现输出的两端的字符,会选择长度较大的放在最左侧(可以自己试试哈),我一直觉得和换行符有关系,实际上是文件格式的问题。
我最终file了一下源文件和自己再终端随便写的test.log
$ file file1.log
file1.log: ASCII text, with CRLF line terminators
$ file test.log
test.log: ASCII text
终于发现端倪,原来是之前的研发给的结果是win下处理的,是windows的某种格式,没有细究,有兴趣的同学自己去研究文件的格式吧。
总之解决问题最重要:
$ dos2unix file1.log file2.log
file1.logdos2unix: converting file tile1.log to UNIX format ...
file2.logdos2unix: converting file tile2.log to UNIX format ...
测试一下:
$ for i in `cat file1.log`; do echo "AAA"$i"BBB"; done
AAAxxxxxxxxxxx05_okBBB
AAAxxxxxxxxxxx06_okBBB
AAAxxxxxxxxxxx07_okBBB
AAAxxxxxxxxxxx08_okBBB
OK,问题解决。
相关文章推荐
- 处理文件CRLF line terminators的问题
- Java处理txt文件遇到的问题 (unicode编码)
- WIN7下的WCF遇到的问题:HTTP 错误 404.17 - Not Found 请求的内容似乎是脚本,因而将无法由静态文件处理程序来处理
- 正确处理浏览器在下载文件时HTTP头的编码问题(Content-Disposition)
- 处理display:inline-block样式ie浏览器兼容性视图不支持的问题
- 处理VS.NET资源文件过程中产生的问题
- java应用程序中处理配置文件和图片路径在打包后路径不对的问题
- <转载>正确处理下载文件时HTTP头的编码问题(Content-Disposition)
- Ubuntu安装记录及遇到的问题——“向硬盘复制文件时遇到错误”、“Minimal BASH-like line editing is supported”
- Android图像处理之Bitmap 生成图片 解析 保存文件 获取 问题
- 导出csv文件时,处理分隔符问题
- 文件后缀与Mime类型对照表/由于扩展配置问题而无法提供您请求的页面。如果该页面是脚本,请添加处理程序。如果应下载文件,请添加 MIME 映射。
- SWFUpload 在IE9下不显示问题及IE9中模态窗下flash文件选择问题的处理
- 处理Linux系统下已删除文件继续占用空间问题
- HTTP 错误 404.3 - Not Found由于扩展配置问题而无法提供您请求的页面。如果该页面是脚本,请添加处理程序。如果应下载文件,请添加 MIME 映射
- 上传文件细节处理问题
- 高字节\低字节 处理大文件中找数字的问题(留给自己看)
- 【Oracle】数据库启动阶段参数文件、控制文件的问题处理
- ie 导出文件 打开进入远程连接问题处理
- python2的编码问题(因split处理文件深入的)