一则python3的简单爬虫代码
2014-05-26 00:00
543 查看
不得不说python的上手非常简单。在网上找了一下,大都是python2的帖子,于是随手写了个python3的。代码非常简单就不解释了,直接贴代码。
关于cookie、异常等处理看了一下,没有花时间去处理,毕竟只是想通过写爬虫来学习python。
#test rdp import urllib.request import re<br> #登录用的帐户信息 data={} data['fromUrl']='' data['fromUrlTemp']='' data['loginId']='12345' data['password']='12345' user_agent='Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)' #登录地址 #url='http://192.168.1.111:8080/loginCheck' postdata = urllib.parse.urlencode(data) postdata = postdata.encode('utf-8') headers = { 'User-Agent' : user_agent } #登录 res = urllib.request.urlopen(url,postdata) #取得页面html<br>strResult=(res.read().decode('utf-8')) #用正则表达式取出所有A标签 p = re.compile(r'<a href="(.*?)".*?>(.*?)</a>') for m in p.finditer(strResult): print (m.group(1))#group(1)是href里面的内容,group(2)是a标签里的文字
关于cookie、异常等处理看了一下,没有花时间去处理,毕竟只是想通过写爬虫来学习python。
相关文章推荐
- 一则python3的简单爬虫代码
- Python实现爬取知乎神回复简单爬虫代码分享
- Python爬虫的简单代码
- python实现简单爬虫功能代码
- Python入门简单的静态网页爬虫3.0 (爬虫的示例代码)
- 5行python代码实现简单的网络爬虫
- Python写一个简单的爬虫样例(不超过50行代码)
- python3简单爬虫实现代码
- python简单爬虫代码,python入门
- Python采集案例:Python实现爬取知乎神回复简单爬虫代码
- python_慕课\Python开发简单爬虫\5-3 Python爬虫urlib2实例代码.py
- python用字符串操作20行代码简单爬虫入门+案例(爬取一章《三体》小说)
- python简单速成,一行代码写爬虫
- Python实现爬取知乎神回复简单爬虫代码分享
- Python实现爬取知乎神回复简单爬虫代码分享
- Python简单两步实现天气爬虫采集器
- Python初学-一个简单的小代码
- 简单网络爬虫代码示例
- 利用python脚本抓取AC的代码[爬虫+HTMLParser+handle_entityref+正则表达式+模拟登陆+文件操作]
- python写简单爬虫的五种方法