您的位置:首页 > 编程语言 > Python开发

python爬虫工具---selenium一个web自动化测试工具

2020-01-12 17:17 441 查看

1、什么是selenium?
selenium一个web自动化测试工具。【但是它本身是不带浏览器】。这个工具其实就是作为一些外部工具驱动来使用的,可以控制一些外部应用来完成自动化测试。
2、phantomjs:他其实就是一个内置无界面浏览器引擎。–无界面可以提高程序运行速度。
因为phantomjs是一个浏览器引擎,所以他最大的功能就是执行页面的js代码。

3.安装selenium和phantomjs?
selenium安装:pip install selenium==2.48.0
phantomjs安装:百度phantomjs镜像--->下载一个Windows版本的————>phantomjs-2.1.1-windows.zip

可视化的chrome浏览器插件:---chromedriver安装:
下载:百度:chromedriver镜像
(1)保证chrome是正版。
(2)查看自己chrome的版本号:73.0.3683.86
(3)找一个和自己版本号最接近的版本下载。

将下载好的exe文件复制到:C:\Anaconda3\Scripts

文档:selenuim常用方法总结.note

链接:http://note.youdao.com/noteshare?id=0142a95cf23fadbaea95809ccb5674b2&sub=02896A50836E4995997A821419D9A063

selenium的使用

配置:
pip install redis 配置非关系型数据库
pip install aiohttp 安装第三方模块
pip install sayncio 安装第三方模块

from selenium import webdriver
from selenium.webdriver.common.keys import Keys
driver = webdriver.Chrome()
driver.get('https://www.baidu.com')
input = driver.find_element_by_id('kw')
print(input)
#WebElement其实就是页面中一些web组件。div,span,input
#WebElement可以做什么呢?
#click()
#send_keys()
driver.save_screenshot('before.png')
input.send_keys(u'python爬虫')
driver.save_screenshot('after.png')
driver.find_element_by_id('su').click()
#哪些方法可以得到webelement对象
''''
find_element_by_id()--通过id来查找
find_element_by_css_selector--通过css选择器查找
find_element_by_xpath---通过xpath表达式查找
'''
#获取元素的坐标
# print(input.location)
#元素大小
# print(input.size)
#获取属性值
# print(input.get_attribute('value'))
#快捷键的使用
input.send_keys(Keys.CONTROL,'a')
input.send_keys(Keys.CONTROL,'x')
input.send_keys(u'人工智能')
driver.find_element_by_id('su').click()

# driver.quit()#退出浏览器
driver.close()#关闭当前页
  • 点赞 1
  • 收藏
  • 分享
  • 文章举报
D_dalei 发布了48 篇原创文章 · 获赞 22 · 访问量 1617 私信 关注
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: