您的位置：首页 > 编程语言 > Python开发

Python爬虫经验

2016-03-07 19:39 507 查看

有时候读取同一个url，服务器可能会返回不同的response，并不是爬虫程序代码的问题，而是服务器的问题，初次试验request时，最好把response文本保存在一个txt文件当中，以便后续的比对。得到response文本之后就可以利用正则表达式或通过查找字符串来获取信息了。

只做get请求时，requests.get(url)和urllib.open(url).read()效果是相同的。

要熟练使用requests库或urllib2库，做get,post请求数据，设置参数，获取head及body。（待续）

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

python模块之 - logging
python小点心--内存文件映射
python 登录并爬取淘宝信息
获取腾讯企业邮箱通讯录python脚本(带登录功能)
python小点心--struct 封装变长字符串
mac下更新pip时提示OSError: [Errno 13] Permission denied: '/Library/Python/2.7/site-packages/pip-8.0.2-py2.
python格式化输出dict等集合对象
[LeetCode]题解（python）：105-Construct Binary Tree from Preorder and Inorder Traversal
Python django学习
[LeetCode]题解（python）：104-Maximum Depth of Binary Tree
[LeetCode]题解（python）：103-Binary Tree Zigzag Level Order Traversal
C\C#\Java\Python 基本数据类型比较
[LeetCode]题解（python）：102- Binary Tree Level Order Traversal
windows系统下Python环境的搭建
[LeetCode]题解（python）：101-Symmetric Tree
【python】编程语言入门经典100例--24
Numpy使用1
Python对象赋值、浅拷贝和深拷贝
python系列之 - 面向对象(二)
[LeetCode]题解（python）：100-Same Tree

新的分享

#新闻拍一拍# 微软推出 Pylance，改善 VS Code 中的 Python 体验
跟我学Python图像处理丨5种图像阈值化处理及算法对比
基于Python设计一个具有基本功能的通讯录
liunx上升级python2至python3
es的查询、排序查询、分页查询、布尔查询、查询结果过滤、高亮查询、聚合函数、python操作es
python常用标准库（时间模块time和datetime）
python之logging日志
python之configparser类的使用
Python常用标准库（pickle序列化和JSON序列化）
MySQL（12） - Python+MySQL读取写入图片
MySQL（11） - Python+MySQL开发新闻管理系统
Python 什么是flask框架？快速入门(flask安装，登录，新手三件套，登录认证装饰器，配置文件，路由系统，CBV)

章节导航