python—cookielib模块对cookies的操作
2016-09-24 13:49
561 查看
最近用python写爬虫爬了点数据,确实是很好用的东西,今天对python如何操作cookie进行一下总结。
python内置有cookielib模块操作cookie,配合urllib模块就可以了很轻易的爬取数据。
python内置有cookielib模块操作cookie,配合urllib模块就可以了很轻易的爬取数据。
#encoding:utf8 import urllib2 import cookielib #获取cookie,并将保存在变量中的cookie打印出来 def Cookie(): #声明一个CookieJar对象来保存cookie cookie = cookielib.CookieJar() #创建cookie处理器 handler = urllib2.HTTPCookieProcessor(cookie) #构建opener opener = urllib2.build_opener(handler) #创建请求 res = opener.open('http://www.baidu.com') for item in cookie: print 'name:' + item.name + '-value:' + item.value #将cookie保存在文件中 def saveCookie(): #设置保存cookie的文件 filename = 'cookie.txt' #声明一个MozillaCookieJar对象来保存cookie,之后写入文件 cookie = cookielib.MozillaCookieJar(filename) #创建cookie处理器 handler = urllib2.HTTPCookieProcessor(cookie) #构建opener opener = urllib2.build_opener(handler) #创建请求 res = opener.open('http://www.baidu.com') #保存cookie到文件 #ignore_discard的意思是即使cookies将被丢弃也将它保存下来 #ignore_expires的意思是如果在该文件中cookies已经存在,则覆盖原文件写入 cookie.save(ignore_discard=True,ignore_expires=True) #从文件中获取cookie并且访问(我们通过这个方法就可以打开保存在本地的cookie来模拟登录) def getCookie(): #创建一个MozillaCookieJar对象 cookie = cookielib.MozillaCookieJar() #从文件中的读取cookie内容到变量 cookie.load('cookie.txt',ignore_discard=True,ignore_expires=True) #打印cookie内容,证明获取cookie成功 for item in cookie: print 'name:' + item.name + '-value:' + item.value #利用获取到的cookie创建一个opener handler = urllib2.HTTPCookieProcessor(cookie) opener = urllib2.build_opener(handler) res = opener.open('http://www.baidu.com') print res.read()
相关文章推荐
- python对cookie的操作模块-cookielib
- 【转】关于python cookielib,urllib2,httplib 模块(HTTP状态码)
- 使用Python中的HTMLParser、cookielib抓取和解析网页、从HTML文档中提取链接、图像、文本、Cookies .
- 使用Python中的HTMLParser、cookielib抓取和解析网页、从HTML文档中提取链接、图像、文本、Cookies(二)(转)
- Python中的HTMLParser、cookielib抓取和解析网页、从HTML文档中提取链接、图像、文本、Cookies(二)
- 使用Python中的HTMLParser、cookielib抓取和解析网页、从HTML文档中提取链接、图像、文本、Cookies
- 黄聪:使用Python中的HTMLParser、cookielib抓取和解析网页、从HTML文档中提取链接、图像、文本、Cookies(二)
- 用Python的Matplotlib模块进行基本的图像操作
- python简单爬虫(上):urllib,urllib2与cookielib三个模块
- 黄聪:使用Python中的HTMLParser、cookielib抓取和解析网页、从HTML文档中提取链接、图像、文本、Cookies(二)
- 使用Python中的HTMLParser、cookielib抓取和解析网页、从HTML文档中提取链接、图像、文本、Cookies(二)
- 【python】使用HTMLParser、cookielib抓取和解析网页、从HTML文档中提取链接、图像、文本、Cookies
- python模块学习 ---- smtplib 邮件发送
- 让python的Cookie.py模块支持冒号做key的方法
- 让python的Cookie.py模块支持:冒号做key
- 转:python模块学习 ---- smtplib 邮件发送
- 使用Python(comtypes)操作ArcGis(ArcObject)的第一步:安装模块到gen文件夹中
- Python常用模块种类的系统介绍及与操作系统相关的调用和操作
- python 的cookie处理操作
- Python常用模块I与操作系统相关的调用和操作