用JAVA编写浏览器内核之实现javascript的document对象与内置方法
2016-03-17 11:56
756 查看
原创文章,转载请注明。
阅读本文之前,您需要对浏览器如何加载javascript有一定了解。当然,对java与javascript本身也需要了解。
本文首先介绍浏览器加载并运行javascript的原理。
其次将介绍如何用java与javascript互调用对象。
最后介绍如何用java实现javascript的document对象与其它内置方法。
浏览器从服务器得到含有javascript代码的html文本后,将顺序执行javascript代码块。
看代码是最简单的方式:
通过实现document对象,就可以动态解析html页面了。
在另外的文章,我将介绍如何结合httpclient,使其成为headless浏览器的雏形。
阅读本文之前,您需要对浏览器如何加载javascript有一定了解。当然,对java与javascript本身也需要了解。
本文首先介绍浏览器加载并运行javascript的原理。
其次将介绍如何用java与javascript互调用对象。
最后介绍如何用java实现javascript的document对象与其它内置方法。
浏览器从服务器得到含有javascript代码的html文本后,将顺序执行javascript代码块。
看代码是最简单的方式:
package org.taoningyu.js; import java.io.IOException; import java.net.MalformedURLException; import java.net.URL; import javax.script.Invocable; import javax.script.ScriptEngine; import javax.script.ScriptEngineManager; import javax.script.ScriptException; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; public class TaoDocument { Document mydoc = null; public TaoDocument(String url) throws MalformedURLException, IOException{ mydoc = Jsoup.parse(new URL(url),30000);//利用Jsoup实现document树 } public Element getElementById(String id){//实现document的getElementById方法 System.out.println("Java println:\t"+mydoc.getElementById(id)); return mydoc.getElementById(id);//返回的是Element对象 } public static void main(String[] args) throws MalformedURLException, IOException { ScriptEngineManager sem = new ScriptEngineManager(); ScriptEngine se = sem.getEngineByName("javascript"); //初始化Java内置的javascript引擎 try { se.eval("function test() {" + "id='areaDefault'; print('js print:'+document.getElementById(id));return document.getElementById(id);}"); //测试用javascript自定义函数,功能为输出id为areaDefault的元素,并返回。 Invocable invocableEngine = (Invocable) se;//转换引擎类型为Invocable se.put("document", new TaoDocument("http://www.ifeng.com/")); //关联对象,这一步很重要,关联javascript的document对象为TaoDocument,亦即我自己实现的document对象 Element callbackvalue=(Element) invocableEngine.invokeFunction("test"); //直接运行函数,返回值为Element System.out.println("callback return :"+callbackvalue); //打印输出返回内容 se.eval("test()");//另外一种调用函数方式,我更偏爱此种方式 } catch (ScriptException e) { // TODO Auto-generated catch block e.printStackTrace(); } catch (NoSuchMethodException e) { // TODO Auto-generated catch block e.printStackTrace(); } } }
通过实现document对象,就可以动态解析html页面了。
在另外的文章,我将介绍如何结合httpclient,使其成为headless浏览器的雏形。
相关文章推荐
- JavaScript函数内部属性和函数方法实例详解
- 造轮子和用轮子:快速入门JavaScript模块化
- JavaScript HTML DOM EventListener
- 引爆你的Javascript代码进化(转)
- Web报表工具FineReport的JS API开发(一)
- js 打开新页面在屏幕中间
- L2-初探JavaScript魅力(1)
- 标签--fieldset
- js调用屏幕宽度
- JavaScript 闭包
- js 判断id 是否存在
- js中的cookie使用
- JSP的九大内置对象(详解)
- js获取项目根路径
- js金额转换大写
- JavaScript 函数调用
- javascript笔记——cookie解析
- Json转换利器Gson之实例一-简单对象转化和带泛型的List转化
- 防止用户直接访问jsp页面的几种办法
- html/JS onload的详解