您的位置:首页 > 编程语言 > Python开发

转:PAMIE- Python实现IE自动化的模块

2011-06-10 10:03 579 查看
PAMIE- Python实现IE自动化的模块(附 网易注册代码) 收藏PAMIE是一套为Python写的用于Web自动化测试的工具,采用Win32COM的方式操作IE来实现。pamie是个很好的操作IE的模块用pamie来操作ie浏览器好方便啊,本来它就是一个IE测试自动化的东西,这样,用pamie来抓取网页,自动提交表单很容易。使用:来测试一个最简单的例子:from cPAMIE import PAMIEie = PAMIE()ie.navigate("google.com")ie.textBoxSet('q','python')ie.buttonClick('btnG')ie.linkClick('Python Programming Language -- Official Website')ie.windowChange('Python Programming Language -- Official Website')ie.windowFind('Python Programming Language -- Official Website')ie.textBoxSet('q',"Automation")ie.buttonClick('submit')直接操作页面上的form元素,访问页面的文本信息,来判断用户登陆是否成功。pamie中怎样处理中文标题的弹出对话框?http://www.python-forum.org/pythonforum/viewtopic.php?f=17&t=3194http://markmail.org/message/u3ojkyj2ns7p3dn3#query:+page:1+mid:5wuwfctervph6tlv+state:resultspython:import cPAMIE, cModalPopUp, winGuiAutoimport timeie = cPAMIE.PAMIE()wga = winGuiAuto# 登录ie.navigate('D:\\python\\WebDialogTest\\1.html')#启动新的进程,自动点击"取消"clickCancel = cModalPopUp.handlePopup("Confirm","取消")clickCancel.popupName = "选择文件"clickCancel.start()ie.buttonClick("install")time.sleep(1)clickCancel.join() #进程结束-------------------------------------------------------------------------------------------------------------------------------------另外一篇介绍:PAMIE 是一个很有意思的模块。它是一个实现IE自动化的模块。在此之前我使用过ClientCookie这个模块,它可以使用urllib2来通过程序访问页面,并且很适合在需要cookie支持的环境中。不过,有些web的访问过程并不仅仅是下载文件这样的事情,有时是一系统的动作。PAMIE应该是一个更直观,更简单的模拟手工输入的过程。不过,局限就是它只支持IE,在某些特殊情况下还是可以的。使用它的话你需要安装win32all模块。下面是它的readme 提供的一个简单示例:import cPAMIEie= cPAMIE.PAMIE()# Start Script:ie.Navigate ('http://pamie.sourceforge.net/pamieform.html')ie.SetTextBox('John','firstname',0)ie.SetTextBox('Doe','lastname',0)ie.SetTextBox('1020 State Street','Addline1',0)ie.SetTextBox('Suite #16','Addline2',0)ie.SetTextBox('San Mateo','city',0)ie.SetListBox('CA','state',0)ie.SetTextBox('90210','zip',0)ie.ClickButton('Submit',0)那么在我们下载完这个模块之后,它是一个zip包。它没有做成安装模式,可以自行将cPAMIE.py拷贝到python安装目录下的lib子目录中即可。上面的代码很简单,先导入cPAMIE模块,然后生成一个自动化对象ie。这时我们会看到程序自动打开一个ie窗口,我们的操作可以在这个ie窗口中看到,执行的部分以黄底显示。ie.Navigate()用来访问一个链接。ie.SetTextBox()用来设置一个文本域的值。第一个参数为输入的值,第二个参数为对应的form表格的Input域的名字(这一点需要查看源码才知识),第三个是form的名字(示例为0表示下标)。ie.SetListBox()用来设置列表框的值。ie.ClickButton()用来模拟点击按钮。第一个参数是按钮的名字,第二个参数为0表示下标。在PAMIE主页中写出了一些可用的其它的方法,如ClickLink()。它的第一个参数为链接对应的文本,如果是中文,转成unicode即可。如页面是GB2312,链接源码为:<a href="http://xxx.com">汉字</a>调用如下:ie.ClickButton(unicode('汉字', 'cp936'))在实际运行中可能不需要这样,只要参数是unicode编码即可。同时如果你查看源码,还可以看到一些其它的方法:Quit() -- 关闭打开的ieGoBack() -- 后退Refresh() -- 刷新大家有兴趣可以试一试,一边操作一边就可以看到结果,很简单也很方便。-------------------------------------------------------------------------------------------------------------------------------第三个文章介绍简单明了的Python,第三方提供的模块或称组件 module 等 也很简单明了的下面是 一个 例子所列举的功能较全了 代码加注解...# -*- coding: cp936 -*-import sys#我把cPAMIE等 pamie2.0里的所有文件放在了 如下路径的 名为pamie 的文件夹里了 加进sys.path方便import 出所有pamie文件夹里的 模块#只要能import CPAMIE 这里的例子就可运行了呵呵sys.path.append(r"F:\Python25\lib\site-packages\pamie")import cPAMIE#new 实例ie= cPAMIE.PAMIE()#打开目标网页ie.navigate ('http://pamie.sourceforge.net/pamieform.html')#注意下面所列的 第一个参数如 fistname 等 都是 网页源代码里的 input name="firstname"#里找出来的,不能用 网页上看见的黑体字: "First Name:"#填文本框ie.textBoxSet('firstname','JustThisName')ie.textBoxSet('lastname','Iamhere')#先择下拉菜单:ie.listBoxSelect('state',"MS")#方形选择框:ie.checkBoxSet('cxbx',1) #1 2 3 或 * 号等都是 "勾选"的意思 '' 空字符串代表取消选择#圆形选择框: 英语是 radio 做过网页设计就容易知道这些元素的命名了#这里选择 Jazzie.radioButtonSet("music","Jazz") # music是这个 选择列表的名字,从网页源代码里找出#最后提交按钮print "now 提交按钮,只要再Python解释器里输入下面这句就 提交 了"#ie.buttonClick("Submit") 用来取代鼠标点击 方便多了#源代码里是 input type="submit" name="Submit" 所以 第一个参数就是name的值"Submit"#pamie是共分 大小写的#ie.buttonClick("Submit")#IE有自已的特性, 好像用 pamie 打开多个网页,都是加在同一个IE进程里的,不是一个网页一个进程'''很多网页较复杂,有图片按钮, javaScript按钮 等的... 若是 图片类按钮用 ie.buttonImageClick("submitRegister")有些按钮是 鼠标点击后 会执行一个 javascript 来提交内容的 如源代码里内容是:<input type="image" src="http://www.sit.com/member/images/register.gif " width="100" height="54" border="0"onClick="javascript:submitMe();就是说 点击 那个 叫做 register.gif的图片会 会执行 javascript:submitMe() 来提交页面...时 可用:ie.javaScriptExecute("javascript:submitMe()") 来自动提交页面. 这类按钮 鼠标移上去后,IE左下角一般会出现 相应的javascript:theFunction() 很容易找...执行 带参数的 javascript function 也是可以的... ie.javaScriptExecute("javascript:submitMe('param')")也可直接设置一个 网页里元素的值:例如 网页源文件里 设置了 document.Form.id.value="string" 可用下面语句直接更改ie.javaScriptExecute("javascript:document.Form.id.value='theValueYouWant'")另外: pamie2.0 里有个 模块用来处理 简单的 弹出窗口 这类窗口的标题一般为: Microsoft Internet Explorerimport cModalPopUpa=cModalPopUp.handlePopup('Confirm',"确定") #"第二个参数是 "确定",表示 弹出窗口的按钮上的 文字是 "确定"这二个字如图:执行:a.run() 就可用程序来点击那个"弹出窗口"的"确定"按钮了...可用多线程程序用一个线程来处理这类窗口就不妨碍主程序了...另外 一个对 pamie 很有用的 填表类工具 : AiRoboForm.exe安装好这个IE工具栏工具后,就可按一下"保存"如上图的"Save"按钮 保存网页表格,然后 鼠标移到 如上图 "Baidu"处停一点时间就出弹出一个子菜单 选择 "edit" 就可看到 那个页面的 表单的 所有名字了 就不用在 源代码里辛苦的找那么多的 "第一个参数" 也就是说 不用自已找 文本框和列表框名称等了, 你可在那个打开了的 编缉器里看到所有的 要填的框的 "名字"了的只是显示的全是"小写"了, 需要在源文件里看一下第一个字母是否是大写等...pamie是 区分大小写的 AiRoboForm是不区分大小写的...pamie2.0也有不足的地方:下文是一个引自 http://yinxl.spaces.live.com/blog/cns!4626e4f8c0bfc0bc!172.entry 的 "扩展补丁".5月14日让PAMIE能轻松控制一个新开的IE窗口这段时间在写一个WEB的测试程序,根据ZV的推荐,采用了Python实现,因为有个PAMIE的开源包在测试WEB页面时非常好用。但是在使用 PAMIE时发现它的findWindow函数非常难用,导致测试程序很难控制新开的IE窗口,例如HTML:<a href="b.html" target="_blank">link_content</a>,这种链接打开的新IE窗口。通过阅读PAMIE的源码也找不到合适的解决办法,只有自己动手啦。我参考了IEC的开源包的方法,自己修改了PAMIE的cPAMIE.py的 PAMIE类的构造函数,修改后的构造函数根据输入的URL地址可以找到当前已经找到的IE窗口,如果没有发现匹配的窗口,那么PAMIE会新建一个窗口打开该URL。下面是修改后的代码:from win32com.client import Dispatch #需求增加的import语句# 2006-5-10 Modified by YinXianglong to find a opened IE Window. BEGINdef __init__(self, url=None, isFind=False, timeOut=300):""" The class instantiation code. When the object is instantiated you canpass a starting URL. If no URL is passed then about:blank, a blankpage, is brought up.parameters:http://172.17.153.171/NewSys/default.aspx" target=_blank> - url to navigate to initially[isFind] - if isFind = True, find a opened IE Window whose LocationURL is equal to url[timeOut] - how many 100mS increments to wait, 10 = 1sec, 100=10secreturns:Nothing"""self.showDebugging = True # Show debug print lines?self.colorHighlight = "#F6F7AD" # Set to None to turn off highlightingself.frameName = None # The current frame name or index. Nested frames are# supported in the format frame1.frame2.frame3self.formName = None # The current form name or indexself.busyTuner = 1 # Number of consecutive checks to verify document is no longer busy.find_ok_flag = Falseif isFind and (url != ''):clsid='{9BA05972-F6A8-11CF-A442-00A0C90A8F39}'# CLSID for ShellWindowsShellWindows = Dispatch(clsid)url = url.lower()for i in range(ShellWindows.Count):if ShellWindows[i].LocationURL.lower().find(url) > -1:self._ie = ShellWindows[i]find_ok_flag = Trueif not find_ok_flag:print "Can't Find the opened IE Window whose LocationURL is equal to url."self._ie = DispatchEx('InternetExplorer.Application')if url:self._ie.Navigate(url)else:self._ie.Navigate('about:blank')self._timeOut = timeOutself._ie.Visible = 1self.timer = datetime.datetime.now()# 2006-5-10 Modified by YinXianglong to find a opened IE Window. END其他代码同PAMIE2.0的代码相同。下面是测试代码:import yxlPAMIEie = yxlPAMIE.PAMIE(" [url=http://172.17.153.171/NewSys/default.aspx]http://172.17.153.171/NewSys/default.aspx ")print ie.pageGetText()测试结果是显示了已经打开的[url=http://172.17.153.171/NewSys/default.aspx]http://172.17.153.171/NewSys/default.aspx 窗口的HTML代码。附录:网易注册程序代码#coding:gbkimport cPAMIEimport timeimport randomusername = ''.join(random.sample('abcdefghijklmnopqrstuvwxyz0123456789',8))password = '******'zhanghao = '|'.join([username,password])ie= cPAMIE.PAMIE()#打开目标网页ie.navigate ('http://reg.163.com/reg0.shtml')#注意下面所列的 第一个参数如 fistname 等 都是 网页源代码里的 input name="firstname"#里找出来的,不能用 网页上看见的黑体字: "First Name:"#填文本框ie.textBoxSet('username',username)ie.textBoxSet('password','*****')ie.textBoxSet('cpassword','*****')#先择下拉菜单:ie.listBoxSelect('question',unicode('我的自定义问题', 'cp936'))#注意此处编码转换 cp936 可以换成GBKie.textBoxSet('myQuestion','wodewentishishenme')ie.textBoxSet('answer','wodoubuxihuan')ie.textBoxSet('year','1986')ie.listBoxSelect('month','6')ie.listBoxSelect('day','22')#方形选择框:#ie.checkBoxSet('cxbx',1) #1 2 3 或 * 号等都是 "勾选"的意思 '' 空字符串代表取消选择#圆形选择框: 英语是 radio 做过网页设计就容易知道这些元素的命名了#这里选择 Jazzie.radioButtonSet("gender","1") # music是这个 选择列表的名字,从网页源代码里找出#最后提交按钮print "请输入验证码 然后提交"#ie.buttonClick("Submit") #用来取代鼠标点击 方便多了i = 0while i<100:passi = i+1if True == ie.findText(unicode('恭喜', 'gbk')):breakfp = open('163zhanghao.txt','a')fp.write(zhanghao+'\n')fp.close()ie.quit()循环注册#coding:gbkimport cPAMIEimport timeimport randomusername = ''.join(random.sample('abcdefghijklmnopqrstuvwxyz0123456789',8))password = 'wokao1'zhanghao = '|'.join([username,password])i = 0while i<1000:ie= cPAMIE.PAMIE()ie.navigate ('https://passport.baidu.com/?reg')ie.textBoxSet('username',username)ie.textBoxSet('loginpass','*****')ie.textBoxSet('verifypass','*****')ie.radioButtonSet("sex","1")ie.textBoxSet("email",username+'@msn.cn')i = 0while i<1000:passi = i+1if True == ie.findText(unicode('恭喜', 'gbk')):breakfp = open('163zhanghao.txt','a')fp.write(zhanghao+'\n')fp.close()ie.quit()i = i+1[转] http://blogold.chinaunix.net/u3/103146/showart_2058891.htmlPython这种脚本语言的强大功能越来越被广大的程序员所重视,这种之前在国内流行度不高的语言近来气势高涨。各种第三方模块层出不穷。本文介绍的便是一种能非常方便操作IE的第三方工具,PAMIE,他能让你如同写JS一样来操作IE浏览器。包括自动启动,访问链接,设置文本框值,获取按钮,执行点击事件,甚至执行页面JS方法等等。下面用一个实际的例子详加说明:以下简短代码便轻易实现,登录本人ChinaUnix,并以此点击日志文章,发文章,设置标题,分类,和博客内容,最后执行确定,发布成功。
# -*- coding: gb2312 -*-
from PAM30 import PAMIE
from string import split
#===============================================================================
# 从文件读取配置信息,登录url,账户,密码等
#===============================================================================
def getCfgFromFile(fileName='settings.txt'):
file = open(fileName)
dict = {}
line = file.readline()
while line != '':
args = split(line, '=')
dict[args[0]] = args[1].decode('utf-8').encode('gb2312')
line = file.readline()
return dict
dict = getCfgFromFile()
ie = PAMIE()
#===============================================================================
# 打开登录页面,设置用户/密码
#===============================================================================
ie.navigate(dict['login-url'])
ie.setTextBox('username', dict['username'])
ie.setTextBox('password', dict['password'])
#===============================================================================
# 获取登录按钮
#===============================================================================
loginbtn = ie.findElement('input', 'type', 'image')
ie.clickElement(loginbtn)
#===============================================================================
# 点击文章管理
#===============================================================================
ie.navigate(dict["article-url"])
#===============================================================================
# 点击写文章
#===============================================================================
mainFrame = ie.getFrame('main')
pwindow = mainFrame.document.parentWindow
pwindow.execScript('NewArticle()')
#===============================================================================
# 设置文章标题,文章分类,系统分类,文章类型
#===============================================================================
mainFrame = ie.getFrame('main')
doc = mainFrame.document
#------------------------------------------------------------------------ 设置文章标题
doc.getElementById('blog_title').value = dict['title']
#------------------------------------------------------------------------ 文章分类-java
doc.getElementById('frmid').value = '119124'
#------------------------------------------------------------------------ 系统分类-java
doc.getElementById('systemfrmid').value = '20'
#----------------------------------------------------------------------- 文章类型-原创
doc.getElementById('arttype').value = dict['arttype']
#===============================================================================
# 填写文章内容
#===============================================================================
pwindow = mainFrame.document.parentWindow
pwindow.execScript('InsertHTML("Python+PAMIE")')
pwindow.execScript('InsertHTML("如此强大的功能")')
#===============================================================================
# 发表文章
#===============================================================================
pwindow.execScript('savearticle()')
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: