使用JTidy将html转化成xhtml
2011-10-31 10:54
155 查看
在做中间件平台的时候,其中有一步就是将html转化成xhtml,这部分由lj负责,于是乎,跑去问了问lj,得知她采用的是JTidy的一个jar文件,于是在网上搜了一下,稍作修改,完成功能是,输入文件为html,输出文件为xhtml.
具体实现如下:
(1)构建路径,引入相应的jar文件jtidy-r938.jar
(2)代码如下:
具体实现如下:
(1)构建路径,引入相应的jar文件jtidy-r938.jar
(2)代码如下:
package beans; import java.io.*; import java.text.*; import java.util.*; import java.net.*; import org.w3c.tidy.Configuration; import org.w3c.tidy.Tidy; public class test { public static void main(String args[]) { testt = newtest(); t.doTidy("c:\\hopetest\\b.html");//转化开始 } public void doTidy(Stringf_in) { BufferedInputStream sourceIn; //输入流 ByteArrayOutputStream tidyOutStream; //输出流 try { Reader reader; FileInputStream fis = new FileInputStream(f_in);//读文件 ByteArrayOutputStream bos = new ByteArrayOutputStream(); int ch; while((ch=fis.read())!=-1) { bos.write(ch); } fis.close(); byte[] bs = bos.toByteArray(); bos.close(); String hope_gb2312=new String(bs,"GB2312");//注意,默认是GB2312,所以这里先转化成GB2312然后再转化成其他的。 byte[] hope_b=hope_gb2312.getBytes(); String basil=new String(hope_b,"utf-8");//将GB2312转化成UTF-8 byte[]basil_b=basil.getBytes(); ByteArrayInputStream stream = newByteArrayInputStream(basil.getBytes()); tidyOutStream = new ByteArrayOutputStream(); Tidy tidy = new Tidy(); tidy.setInputEncoding("UTF-8"); tidy.setQuiet(true); tidy.setOutputEncoding("UTF-8"); tidy.setShowWarnings(false); //不显示警告信息 tidy.setIndentContent(true);// tidy.setSmartIndent(true); tidy.setIndentAttributes(false); tidy.setWraplen(1024); //多长换行 //输出为xhtml tidy.setXHTML(true); tidy.setErrout(newPrintWriter(System.out)); tidy.parse(stream, tidyOutStream); DataOutputStream to=new DataOutputStream(new FileOutputStream("C:\\hopetest\\bb.xhtml")); //将生成的xhtml写入 tidyOutStream.writeTo(to); System.out.println(tidyOutStream.toString()); } catch ( Exception ex ) { System.out.println( ex.toString()); ex.printStackTrace(); } } } |
相关文章推荐
- 使用JTIDY将html转成xhtml
- 有关于用JTidy处理HTML转化为标准的XHTML或者XMl出现空的问题
- html和xhtml引入javascript时的使用CDATA代码片段
- 在XHTML和HTML中准确使用语言信息
- 使用php对html标签与字符串html之间的相互转化
- JTidy将html转换成xhtml
- 使用xslt将xml转化为xhtml的形似(下两种方法不要进行xsl文件的引用)
- 如何将HTML4.01转化为XHTML1.0
- 使用 JTidy 将 HTML 文件转换成 XML
- 从HTML到XHTML--使用Web标准建设网站
- html to xml:Jtidy的使用及注意事项(jtidy-r938)
- Java中使用XML标签<x:transform />转化XML为HTML
- HTML 4.0 Strict和XHTML 1.0 STRICT里在标签里使用target属性
- HTML教程XHTML教程:HTML标记嵌套使用技巧
- HTML/xHTML标签语义化使用指南 你真的懂网页语义化吗?
- XHTML中不再使用HTML中的一些废弃元素
- showdown.js使用示例(把markdown转化为html)
- 从HTML到XHTML--使用Web标准建设网站 《转》
- vue 使用html2canvas将DOM转化为图片的方法
- 使用html2canvas将html标签转化为图片