urllib2模块学习--基本使用
2014-04-21 13:57
183 查看
urllib2:用于抓取网页信息的模块。
第一种使用方法:
第一种使用方式只能由于简单的web请求,但需要更加灵活的web请求,需要使用第二种方法。
比如给添加headers,传送data等。
添加headers,伪装成浏览器访问页面
关于request和response的属性
上面req是个Request对象,有关于它的属性,可以使用dir(req)打印出来。
上面res是个file-like对象,使用dir(res)可以查询属性。
本文出自 “fly天地” 博客,请务必保留此出处http://liuping0906.blog.51cto.com/2516248/1399506
第一种使用方法:
# coding:utf-8 import urllib2 url = 'http://www.baidu.com' res = urllib2.urlopen(url) print res.read()第二种使用方法:
# coding:utf-8 import urllib2 url = 'http://www.baidu.com' req = urllib2.Request(url) res = urllib2.urlopen(req) print res.read()
第一种使用方式只能由于简单的web请求,但需要更加灵活的web请求,需要使用第二种方法。
比如给添加headers,传送data等。
添加headers,伪装成浏览器访问页面
# coding:utf-8 import urllib2 url = 'http://www.baidu.com' headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:27.0) Gecko/20100101 Firefox/27.0'} req = urllib2.Request(url,headers=headers) res = urllib2.urlopen(req) print res.read()
关于request和response的属性
上面req是个Request对象,有关于它的属性,可以使用dir(req)打印出来。
host = req.get_host() # 获取请求主机名 req.add_header(key,val) # 添加headers
上面res是个file-like对象,使用dir(res)可以查询属性。
url = res.url # 获取请求Url code = res.code # 获取返回状态码
本文出自 “fly天地” 博客,请务必保留此出处http://liuping0906.blog.51cto.com/2516248/1399506
相关文章推荐
- Python学习笔记-模块介绍(一)-模块概念和基本使用
- 学习爬虫基础3-urllib2库的基本使用
- Python学习urllib2模块使用
- Python3学习笔记(urllib模块的使用)转http://www.cnblogs.com/Lands-ljk/p/5447127.html
- 微软企业库5.0 学习之路——第九步、使用PolicyInjection模块进行AOP—PART1——基本使用介绍
- Python数据挖掘学习02--numpy和pandas模块基本使用
- [EntLib]微软企业库5.0 学习之路——第九步、使用PolicyInjection模块进行AOP—PART1——基本使用介绍
- python数据持久存储:pickle模块的基本使用 分类: python python基础学习 python 小练习 2013-06-17 14:41 209人阅读 评论(0) 收藏
- Python3学习笔记 urllib模块的使用
- Python爬虫学习--urllib的基本使用笔记
- urllib2模块学习--opener和handlers使用
- Android 2D Graphics学习(二)、Canvas篇1、Canvas基本使用
- 搬迁学习笔记1——Handler的基本使用、子线程更新UI的方式
- [python]-urllib2和urllib模块使用
- Android 存储学习之SQLite数据库的基本操作 (使用API操作数据库)
- Hive简介、什么是Hive、为什么使用Hive、Hive的特点、Hive架构图、Hive基本组成、Hive与Hadoop的关系、Hive与传统数据库对比、Hive数据存储(来自学习资料)
- iOS学习笔记----NSTimer(基本使用,DefaultRunLoopMode,NSRunLoopCommonModes,准确性)
- python使用urllib模块开发的多线程豆瓣小站mp3下载器