利用cheerio模块实现爬虫某网页图片并存储到本地文件夹
任意网页都可以爬虫:
const http = require('http')
const cheerio = require('cheerio')
const fs=require('fs')
let url='http://www.nipic.com/photo/xiandai/jiaotong/index.html?page=4'
http.get(url, (res) => {//框架
let txt = '';
res.on('data', (data) => {//数据获取data事件
txt += data;
})
res.on('end', () => {//end事件,对数据进行处理
tmp(txt);
})
})
function tmp(data){//具体处理函数
let arr=[];
let $=cheerio.load(data);//加载dom对象
let tmp_div=$('img')//直接获取标签
tmp_div.each((index,item)=>{//多个标签操作直接用each,不能forEach
var xx=$(item)
//console.log(xx.attr())//先输出以下此标签的各个属性和其值,然后看看如何选择。
//console.log(xx.attr('data-src'))//使用attr获取属性的值
arr.push(xx.attr('data-src'))//把每一张图片的路径放到数组中
})
for(i in arr){
((i)=>{
setTimeout(() => {
tmp2(arr[i])//循环遍历数组值,调用管道输出到文件目录中
}, 500*i)
})(i)
}
}
function tmp2(url1){
http.get(url1,(res)=>{
console.log(url1)
let name=new Date().getTime();
let asd=fs.createWriteStream('./tmp/' + name + '.png')//文件名拼接
res.pipe(asd)//实现输出
})
}
爬虫框架如下:任意网页都可以实现爬虫:
const http = require('http')
const cheerio = require('cheerio')
const fs=require('fs')
let url='http://www.nipic.com/photo/xiandai/jiaotong/index.html?page=4'
http.get(url, (res) => {//框架
let txt = '';
res.on('data', (data) => {
txt += data;
})
res.on('end', () => {
tmp(txt);
})
})
function tmp(data){
}
function tmp2(url1){
}
- 利用Python爬虫实现网页图片批量下载
- 用python3的urllib()模块实现爬取网页上的图片,并保存到指定文件夹
- Py之Crawler:爬虫利用随机选取代理访问服务器的方法实现下载某网址上所有的图片到指定文件夹——Jason niu
- Python爬虫抓取糗百的图片,并存储在本地文件夹
- 把本地硬盘里的图片存储到oracle数据库里blob的实现
- 利用ActiveX实现本地文件夹选择功能(JS,HTML)
- 转载:利用本地存储实现记录滚动条的位置
- PHP上传图片到数据库和存储到本地文件夹的方法
- java+js实现展示本地文件夹下的所有图片demo
- 利用URL Protocol实现网页调用本地应用程序
- java爬虫小demo实现获取网页图片
- 利用html5的本地存储功能实现登录用户信息保存
- Python爬虫实现抓取网页图片
- nodejs利用ajax实现网页无刷新上传图片实例代码
- 用TreeView控件实现资源管理器(显示本地硬盘下所有文件夹和文件,并可以浏览图片)(示例代码下载)
- 利用FileReader实现上传图片前本地预览
- 利用本地存储实现记录滚动条的位置
- 网页设计中利用CSS实现背景图片平铺的技巧
- wxPython利用pytesser模块实现图片文字识别
- 利用pytesser模块实现图片文字识别