delphi 如何判断编码格式,解决乱码问题
2016-01-24 15:56
239 查看
前阵子因为需要用到idhttp下载网页,然而令人很生气的是,他下载的html源码是乱码的,这样子是没有办法使用的,所以就必须要把他进行编码格式转换,然而令人困扰的是,他是什么格式,又该怎么转,转成什么格式,这都是问题,转成什么格式,自然是ansi ,可以正常人看的懂的才行了,该怎么转,就必须先知道原先是什么格式了,,他是什么格式,这个就不好办了
网页格式,不外乎三种,utf8 ,gbk,gb2312, 再细分的话,utf8 属于双字节,gbk,gb2312属于单字节,他们的编码方式分别为 unicode 和ansi ;也就是说,我们下载的网页他们的编码方式就是unicode 和ansi,那么目标明确了我们需要做的是,判断网页到底是哪种编码,二选一,然而很遗憾的是,在网上并没有找到有用的信息,而且也没有找到能够判断字符是属于那种编码的函数,于是自己就想了个方法,写了下面的语句:
function htmlDecode(html:string);
begin
html:=lowercase(html);
if (not containtext('charset=',html) or containtext('=utf',html)) then
html:=utf8decode(html);
result:=html;
end;
这个函数对于大多数网页还是有效果的,然而却存在两个问题:
1、如果"charset=" 等号和charset 中间存在空格,那么就会出问题,
2、用这个方法解析出来的网页,虽然是ansi的,而且也能看懂,然而,在有的标签和中文间转换会出错,会把标签的"<" 和中文的编码,一起转义成"?"号,破坏html文件。
若果对于标签不是很在乎的还是可以用,然而对于需要的却是个灾难性问题,后来在看一篇文章的时候,找到了另一种有效的方法;
方法二:
这种方法使用的是预编译,如下:
function htmldecode(html:string):string;
begin
{$IFDEF UNICODE}
result:=html;
{$ELSE}
result:=utf8decode(html);
{$ENDIF}
end;
用这种方法后,第一种的出现的问题都没了。
总结:第一种方法并不是没用,二手没有找到足够的判断条件
网页格式,不外乎三种,utf8 ,gbk,gb2312, 再细分的话,utf8 属于双字节,gbk,gb2312属于单字节,他们的编码方式分别为 unicode 和ansi ;也就是说,我们下载的网页他们的编码方式就是unicode 和ansi,那么目标明确了我们需要做的是,判断网页到底是哪种编码,二选一,然而很遗憾的是,在网上并没有找到有用的信息,而且也没有找到能够判断字符是属于那种编码的函数,于是自己就想了个方法,写了下面的语句:
function htmlDecode(html:string);
begin
html:=lowercase(html);
if (not containtext('charset=',html) or containtext('=utf',html)) then
html:=utf8decode(html);
result:=html;
end;
这个函数对于大多数网页还是有效果的,然而却存在两个问题:
1、如果"charset=" 等号和charset 中间存在空格,那么就会出问题,
2、用这个方法解析出来的网页,虽然是ansi的,而且也能看懂,然而,在有的标签和中文间转换会出错,会把标签的"<" 和中文的编码,一起转义成"?"号,破坏html文件。
若果对于标签不是很在乎的还是可以用,然而对于需要的却是个灾难性问题,后来在看一篇文章的时候,找到了另一种有效的方法;
方法二:
这种方法使用的是预编译,如下:
function htmldecode(html:string):string;
begin
{$IFDEF UNICODE}
result:=html;
{$ELSE}
result:=utf8decode(html);
{$ENDIF}
end;
用这种方法后,第一种的出现的问题都没了。
总结:第一种方法并不是没用,二手没有找到足够的判断条件
相关文章推荐
- Delphi实现http发送xml文件片段
- Orace查询数据出现乱码的问题解决思路
- oracle em 按钮乱码解决办法及em网页变成英文
- Delphi实现毫秒级别的倒计时实例代码
- Delphi7中Listview的常用功能汇总
- 插件管理框架 for Delphi(一)
- delphi中一个值得大家来考虑的DLL问题
- Delphi实现检测并枚举系统安装的打印机的方法
- delphi 正弦曲线图
- Delphi下OpenGL2d绘图之画四边形的方法
- Delphi实现木马文件传输代码实例
- delphi建立、读取、存贮INI文件的方法《三》
- Delphi控件ListView的属性及使用方法详解
- delphi制作wav文件的方法
- Delphi下OpenGL2d绘图之画点的方法
- Delphi下OpenGL2d绘图之初始化流程详解
- Delphi实现窗体感知鼠标滑过并自动隐藏与显示窗口的方法
- Delphi实现截屏存盘的方法
- Delphi实现碰撞球体完整实例代码
- delphi建立、读取、存贮INI文件的方法《二》