在CentOS下利用Python+selenium获取腾讯首页的今日话题。
2016-12-12 16:46
651 查看
1、安装依赖包
yum install wget firefox gcc zlib zlib-devel Xvfb
2、安装setuptools
官网地址:https://pypi.python.org/pypi/setuptools
百度地址:http://pan.baidu.com/s/1i5JlRH7
3、安装selenium
官网地址:https://pypi.python.org/pypi/selenium#downloads
百度地址:http://pan.baidu.com/s/1miJfI7A
4、安装PyVirtualDisplay
官网地址:https://pypi.python.org/pypi/PyVirtualDisplay
百度地址:http://pan.baidu.com/s/1gf2uUBL
注意:如果提示EasyProcess相关的错误 ,请先安装EasyProcess再安装PyVirtualDisplay。
EasyProcess下载地址:https://pypi.python.org/pypi/EasyProcess 安装方法和PyVirtualDisplay一样
由于我的CentOS是没有界面的,所以需要安装PyVirtualDisplay来模拟。
5、安装geckodriver
官网地址:https://github.com/mozilla/geckodriver/releases
百度地址:http://pan.baidu.com/s/1i54YH5z
6、Python代码
执行效果:
其他资料
selenium-webdriver+python基本操作:http://pan.baidu.com/s/1nvCsmBR
yum install wget firefox gcc zlib zlib-devel Xvfb
2、安装setuptools
官网地址:https://pypi.python.org/pypi/setuptools
百度地址:http://pan.baidu.com/s/1i5JlRH7
tar zxvf setuptools-31.0.0.tar.gz cd setuptools-31.0.0 python setup.py install
3、安装selenium
官网地址:https://pypi.python.org/pypi/selenium#downloads
百度地址:http://pan.baidu.com/s/1miJfI7A
tar zxvf selenium-3.0.2.tar.gz cd selenium-3.0.2 python setup.py install
4、安装PyVirtualDisplay
官网地址:https://pypi.python.org/pypi/PyVirtualDisplay
百度地址:http://pan.baidu.com/s/1gf2uUBL
tar zxvf PyVirtualDisplay-0.2.1.tar.gz cd PyVirtualDisplay-0.2.1 python setup.py install
注意:如果提示EasyProcess相关的错误 ,请先安装EasyProcess再安装PyVirtualDisplay。
EasyProcess下载地址:https://pypi.python.org/pypi/EasyProcess 安装方法和PyVirtualDisplay一样
由于我的CentOS是没有界面的,所以需要安装PyVirtualDisplay来模拟。
5、安装geckodriver
官网地址:https://github.com/mozilla/geckodriver/releases
百度地址:http://pan.baidu.com/s/1i54YH5z
tar zxvf geckodriver-v0.11.1-linux64.tar.gz mv geckodriver /usr/local/bin
6、Python代码
# -*- coding: utf-8 -*- from selenium import webdriver from pyvirtualdisplay import Display display = Display(visible=0, size=(800,600)) display.start() dr = webdriver.Firefox() dr.get('http://www.qq.com/') url = dr.find_element_by_css_selector('#todaytop a').get_attribute('href') dr.get(url) #获取标题 title = dr.find_element_by_id('sharetitle').text print(title) #获取内容 content = dr.find_element_by_id('articleContent').get_attribute('innerHTML') print(content) dr.quit()
执行效果:
其他资料
selenium-webdriver+python基本操作:http://pan.baidu.com/s/1nvCsmBR
相关文章推荐
- 用python+selenium将腾讯首页今日话题的内容自动发表到自己cnblog里
- 用python+selenium将腾讯首页今日话题的内容自动发表到自己cnblog里
- python利用selenium获取cookie实现免登陆
- 利用python+selenium_phantomjs批量获取百度指数 第一步 分析
- Python爬虫获取cookie:利用selenium
- python下利用Selenium获取动态页面数据
- python + selenium + PhantomJS 获取腾讯应用宝APP评论
- Python+Selenium爬虫实战一《将QQ今日话题发布到个人博客》
- 利用python+selenium_phantomjs批量获取百度指数 第二步 技术细节
- 利用python+selenium_phantomjs批量获取百度指数 第三步 代码
- python 利用selenium模拟登录帐号验证网站并获取cookie
- python 利用selenium模拟登录帐号验证网站并获取cookie
- [Python爬虫] 之二十七:Selenium +phantomjs 利用 pyquery抓取今日头条视频
- 利用Python获取OpenCV中lib文件的文件名
- 利用Python获取ZOJ所有题目的名字
- 利用python 获取 windows 组策略
- Python入门小练习 003 利用cookielib模拟登录获取账户信息
- 【python+selenium】2、获取元素,并跳转页面
- Python 获取两个话题的交集
- selenium2+python元素状态获取api