node爬虫1
2020-07-14 06:10
429 查看
在古诗文网上爬下了唐诗三百首,并把内容保存至MySQL数据库。
var myRequest = require('request') var myCheerio = require('cheerio') var mysql = require('mysql') var fs = require('fs') let options = { host : "127.0.0.1", port : "3306", user : "root", password : "root", database : "tangpoem" } let con=mysql.createConnection(options); con.connect((err)=>{ if(err){ console.log(err); } }) var myURL = 'https://so.gushiwen.org/gushi/tangshi.aspx' function request(url, callback) { var options = { url: url, encoding: null, headers: null } myRequest(options, callback) } request(myURL, function (err, res, body) { var html = body; var $ = myCheerio.load(html, { decodeEntities: false }); $(".sons a").each(function(index,element){ href = element.attribs.href; exp=/^\/shiwenv/ if(exp.test(href)){ next(href) } }) ; }) function next(href){ href = "https://so.gushiwen.org" + href; request(href, function (err, res, body) { if(err){ console.log(err) } var html = body; var $ = myCheerio.load(html, { decodeEntities: false }); title = $("h1").text() content = $('meta[name="description"]').eq(0).attr("content"); // console.log(title) // console.log(content) let strsql = "insert into poem(title,content) values (?,?)" con.query(strsql,[title,content],(err,results)=>{ if(err){ console.log(err) } }) }) }
效果:
相关文章推荐
- Node.js大众点评爬虫
- Node.js爬虫-爬取慕课网课程信息
- [js高手之路]Node.js实现简易的爬虫-抓取博客所有文章列表信息
- node 爬虫 --- 批量下载图片
- node 爬虫 --- 将爬取到的数据,保存到 mysql 数据库中
- node.js实现博客小爬虫的实例代码
- <node.js爬虫>制作教程
- node.js 小爬虫抓取网页数据(2)
- 随手写个node爬虫
- Node.js 实现爬虫(1) —— 简单的爬虫程序
- Node.js编写爬虫的基本思路及抓取百度图片的实例分享
- Node.js新闻爬虫实验项目(2)参考教程与开发工具
- 从0到1学习node之简易的网络爬虫
- node.js+mongodb 爬虫
- 从零学习node.js之简易的网络爬虫(四)
- 继续Node爬虫 — 百行代码自制自动AC机器人日解千题攻占HDOJ
- Node.js简单爬虫开发过程
- node+experss实现爬取电影天堂爬虫
- 用node写的爬虫(一版)
- 用node写的爬虫(二版)