您的位置:首页 > 编程语言 > Python开发

使用Selenium2 Python实现网页登陆过程

2015-01-13 18:59 831 查看
Selenium是常见的UI自动化工具,利用Selenium可以实现很多常用的网页操作。Selenium2相比于Selenium1,核心的升级在于引入了Webdriver。在使用Webdriver之前,Selenium主要是在浏览器中运行Javascript来实现自动化的操作,由于Javascript的安全模型等因素的限制,有一定的局限性。Webdriver不再依赖于Javascript,它通过原生浏览器支持或者浏览器扩展直接控制浏览器。它的工作原理大致如下:

首先,Webdriver启动浏览器并绑定端口,该启动浏览器作为Webdriver的remote server。然后客户端通过The Webdriver Wire Protocol给remote server的监听端口发送请求。Remote server 收到请求后,使用原生的浏览器组件(如:IEDriverServer.exe、Chromedriver.exe等),将请求转化浏览器的本地调用。下面介绍使用Selenium2来实现登录CSDN网站的过程。

#coding=utf-8
from selenium import webdriver
driver=webdriver.Firefox() #启动Firefox浏览器实例
driver.get("https://passport.csdn.net/account/login?from=http://my.csdn.net/my/mycsdn") #访问CSDN登陆页
driver.find_element_by_id("username").clear() #清除用户名输入框中的内容
driver.find_element_by_id("username").send_keys("yourusername") #输入用户名
driver.find_element_by_id("password").clear() #清除密码输入框中的内容
driver.find_element_by_id("password").send_keys("yourpassword") #输入密码
driver.find_element_by_xpath("/html/body/div[2]/div/div/div[2]/div/div[1]/div/form/input[6]").click() #点击登录按钮

#登录完成后,获取网页的title,通过检查title来验证是否登录成功
title=driver.title
print title
if title==u"我的CSDN":
print u"登录成功"

#获取页面中的用户名
user=driver.find_element_by_xpath("/html/body/div[6]/div[2]/div[1]/div[1]/div[2]/div[1]/span/a").text
print user
else:
print u"登录失败"

这里对于以上代码做一些说明。

1. 第一行的#coding=utf-8建议加上,因为Python对于编码的处理比较容易出问题,特别是有中文的时候,应该统一指定编码格式。

2. webdriver定位网页元素的方式比较多,可以根据id, name, tag, xpath, css等。使用id, name, tag这些方式定位元素比较简单和方便,缺陷是这些属性不一定存在,另一方面,它们也不具备唯一性。 利用xpath定位,可以深入网页的层次结构,更加准确,但是维护比较麻烦,不同的浏览器也可能存在差异。不熟悉Xpath的同学,可以利用Firebug查看组件的xpath路径。对于组件的定位,笔者的建议是,能使用id或者name等简单方式确定的元素就用这类方式确定;层次结构复杂,属性不全的元素,可以通过xpath或者css等方式确定。

3. 完成登录后,需要对是否登录成功进行检查,一般可以通过以下几种方式:

1) 检查当前页面的title是否正确

2)检查当前页面的url是否正确

3)检查当前页面中的某些元素是否正确,例如,登录成功后应该显示的用户名,模块名等等。

这里采用了检查title和用户名的方式。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: