selenium,phantomJS,python整合的一个小示例,把某个网页画面整体保存成图片格式。
2017-04-11 15:04
579 查看
本篇将使用selenium,phantomJS和python制作的一个示例,把某个网页整体保存为一个图片文件。
简单介绍下,selenium是一个开源的用于测试web程序的工具,当然,如果你要执行一些工作量很大的web程序,一定少不了它。支持市面上大部分浏览器。
PhantomJS是一个无界面的,可用javascript编程的WebKit浏览器引擎。它原生支持多种web 标准:DOM 操作,CSS选择器,JSON,Canvas 以及SVG,速度很快。
我的环境:
win10,python3.5.3,phantomjs-2.1.1,selenium3.3.3
安装:
1:python,下载地址 https://www.python.org/downloads/windows/
2:phantomjs,下载地址 http://phantomjs.org/
解压缩phantomjs文件放到合适的目录,并将phantomjs.exe所在的文件夹放到window系统变量PATH下,我这里是:C:\imi\dev\tools\phantomjs-2.1.1\bin。
3:selenium,在win命令行执行:pip install selenium 或者:pip install -U selenium进行安装。
python代码:
保存为 C:\imi\dev\python\3.5.3\selephantm.py
执行:如果你使用的是sublime text,直接ctr+b即可执行;
win命令行请执行:python selephantm.py;
结束后,你会在selephantm.py所在的目录下看到sohu.png文件。
好吧,我把大图端上来看看:
简单介绍下,selenium是一个开源的用于测试web程序的工具,当然,如果你要执行一些工作量很大的web程序,一定少不了它。支持市面上大部分浏览器。
PhantomJS是一个无界面的,可用javascript编程的WebKit浏览器引擎。它原生支持多种web 标准:DOM 操作,CSS选择器,JSON,Canvas 以及SVG,速度很快。
我的环境:
win10,python3.5.3,phantomjs-2.1.1,selenium3.3.3
安装:
1:python,下载地址 https://www.python.org/downloads/windows/
2:phantomjs,下载地址 http://phantomjs.org/
解压缩phantomjs文件放到合适的目录,并将phantomjs.exe所在的文件夹放到window系统变量PATH下,我这里是:C:\imi\dev\tools\phantomjs-2.1.1\bin。
3:selenium,在win命令行执行:pip install selenium 或者:pip install -U selenium进行安装。
python代码:
from selenium import webdriver print("start....\n") driver = webdriver.PhantomJS() url = "http://www.sohu.com/" driver.get(url) driver.save_screenshot("sohu.png") print("ok!\n")
保存为 C:\imi\dev\python\3.5.3\selephantm.py
执行:如果你使用的是sublime text,直接ctr+b即可执行;
win命令行请执行:python selephantm.py;
结束后,你会在selephantm.py所在的目录下看到sohu.png文件。
好吧,我把大图端上来看看:
相关文章推荐
- python爬虫三:获取一个网易用户的所有图片(selenium+phantomjs)
- Python保存一个网页的全部内容(包含链接内的图片等等)
- Python爬虫学习——使用selenium和phantomjs爬取js动态加载的网页
- 随便写的一个python小程序,从网页中下载图片
- 黄聪:python访问抓取网页常用命令(保存图片到本地、模拟POST、GET、中文编码问题)
- 数据保存!!!Python 爬取网页数据后,三种保存格式---保存为txt文件、CSV文件和mysql数据库
- python 实现一个贴吧图片爬虫的示例
- 第三百五十节,Python分布式爬虫打造搜索引擎Scrapy精讲—selenium模块是一个python操作浏览器软件的一个模块,可以实现js动态网页请求
- python抓取网页中图片并保存到本地
- 黄聪:python访问抓取网页常用命令(保存图片到本地、模拟POST、GET、中文编码问题)
- python连续爬取多个网页的图片分别保存到不同的文件夹
- 使用Python保存网页上的图片或者保存页面为截图
- [Python爬虫]Scrapy配合Selenium和PhantomJS爬取动态网页
- python 网页抓取并保存图片
- python抓取豆瓣图片并自动保存示例学习
- 用Python写一个网络爬虫爬取网页中的图片
- python爬虫实战(1)抓取网页图片自动保存
- python学习--抓取一个网页上图片
- Python+selenium实现截图图片并保存截取的图片