vim 文本 编码 gb2312 转换为 utf8 格式 回车与换行
2010-09-08 16:59
316 查看
关于回车与换行
/n //也是一种换行特殊字符很久以前,老式的电传打字机使用两个字符来另起新行。一个字符把滑动架移回首位 (称为回车,<CR>,ASCII码为0D),另一个字符把纸上移一行 (称为换行, <LF>,ASCII码为0A)。当计算机问世以后,存储器曾经非常昂贵。有些人就认定没必要用两个字符来表示行尾。UNIX 开发者决定他们可以用 一个字符来表示行尾,Linux沿袭Unix,也是<LF>。Apple 开发者规定了用<CR>。开发 MS-DOS以及Windows 的那些家伙则决定沿用老式的<CR><LF>。
因为MS-DOS及Windows是回车+换行来表示换行,因此在Linux下用Vim查看在Windows下用VC写的代码,行尾后的“^M”符号,表示的是符。
在Vim中解决这个问题,很简单,在Vim中利用替换功能就可以将“^M”都干掉,键入如下替换命令行:
:%s/^M//g
注意:上述命令行中的“^M”符,不是“^”再加上“M”,而是由“Ctrl+v”、“Ctrl+M”键生成的
关于gb2312编码文本转换为utf8格式
iconv命令用于转换指定文件的编码,默认输出到标准输出设备,亦可指定输出文件。用法: iconv [选项...] [文件...]
有如下选项可用:
输入/输出格式规范:
-f, --from-code=名称 原始文本编码
-t, --to-code=名称 输出编码
信息:
-l, --list 列举所有已知的字符集
输出控制:
-c 从输出中忽略无效的字符
-o, --output=FILE 输出文件
-s, --silent 关闭警告
--verbose 打印进度信息
-?, --help 给出该系统求助列表
--usage 给出简要的用法信息
-V, --version 打印程序版本号
示例:
iconv -f utf-8 -t gb2312 aaa.txt >bbb.txt
这个命令读取aaa.txt文件,从utf-8编码转换为gb2312编码,其输出定向到bbb.txt文件。
set fileecoding=gbk //也可以改文件编码
以上转载自:http://blog.chinaunix.net/u1/50685/showart.php?id=1072877
相关文章推荐
- Python 爬虫编码格式问题 gb2312转换utf8
- 【转载】实现UTF8与GB2312编码格式相互转换(VC)已经验证!
- asp.net 转换GB2312 的字符串为UTF8编码
- Java中将数据由UTF8转换成GB2312格式
- UTF8编码格式的中英文字符如何换行
- Windows & Unix 文件格式之迷, 空格、回车换行、tab 转换及其相关工具 .
- asp.net 转换GB2312 的字符串为UTF8编码
- 多种国际编码格式之间进行文本内码的转换
- AFNetworking2.0参数默认编码格式是UTF8,如何指定参数编码格式为gb2312
- Jsoup爬取网页乱码编码格式gb2312转utf8
- UBUNTU中 VIM 查看GB2312编码文本乱码解决方法
- php字符编码转换之gb2312转为utf8
- Windows & Unix 文件格式之迷, 空格、回车换行、tab 转换及其相关工具
- 将编码格式为utf8转换为GBK的一个脚本
- 浏览器内javascript 转换gbk文本到UTF8编码(chrome, firefox only)
- Java中将数据由UTF8转换成GB2312格式-Java基础-Java-编程开发
- 将utf8等编码格式转换为shift_jis格式
- 使用编码格式转换工具将cpp文件由GB18030转成UTF8
- 将utf8等编码格式转换为shift_jis格式
- iconv内容,convmv文件名,unix2dos,dos2unix文件格式转换,od/cut/wc/dd/diff/uniq/nice/du等命令,linux文件名乱码,文件名,文件内容,vim编码设置