node.js用get方式获取网页中的链接
2016-03-31 00:00
531 查看
get方式获取网页中的链接
转载自:http://www.9958.pw/post/nodejs_get_html_a
var http = require('http'); //定义函数 var getAHref = function(htmlstr){ var reg = /<a.+?href=('|")?([^'"]+)('|")?(?:\s+|>)/gim; var arr = []; while(tem=reg.exec(htmlstr)){ arr.push(tem[2]); } return arr; } var qHref = "http://xxx";//设置被查询的目标网址 var req = http.get(qHref, function(res) { var pageData = ""; res.setEncoding('utf8'); res.on('error', function (errget) { //出错处理 }); res.on('data', function (chunk) { pageData += chunk; }); res.on('end', function(){ //console.dir(pageData); var content = pageData;//获取到网页内容 var hrefs=getAHref(content);//获取链接 }); });
转载自:http://www.9958.pw/post/nodejs_get_html_a
相关文章推荐
- 使用ruby部署工具mina快速部署nodejs应用教程
- Google官方支持的NodeJS访问API,提供后台登录授权
- 浅谈Nodejs观察者模式
- nodejs教程之环境安装及运行
- nodejs中的fiber(纤程)库详解
- 基于NodeJS的前后端分离的思考与实践(五)多终端适配
- 基于NodeJS的前后端分离的思考与实践(二)模版探索
- 实例详解Nodejs 保存 payload 发送过来的文件
- 我的NodeJs学习小结(一)
- nodejs中实现sleep功能实例
- Nodejs异步回调的优雅处理方法
- Windows系统下使用Sublime搭建nodejs环境
- nodejs实现获取某宝商品分类
- nodejs简单实现中英文翻译
- Node.js插件的正确编写方式
- 使用upstart把nodejs应用封装为系统服务实例
- NodeJS Web应用监听sock文件实例
- Nodejs学习笔记之测试驱动
- Nodejs学习笔记之Stream模块
- 如何正确使用Nodejs 的 c++ module 链接到 OpenSSL