python爬虫-第二课
2018-09-14 09:21
106 查看
1.cookie保持 (cookie原理视频)
把每一次请求的cookie 保存起来,下一次请求需要用
2.验证码原理
3.登录流程
-1访问登录页面
url = https://kyfw.12306.cn/otn/login/init
method = get
-2下载验证码(是图片,它一定会依赖cookie)
url = https://kyfw.12306.cn/passport/captcha/captcha-image?login_site=E&module=login&rand=sjrand&0.20111433490049846
method = get
#!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2018/6/21 0021 19:18 import random import requests # cookie保持 session = requests.Session() # requests.Session这个类帮我们去实现cookie保持 # 浏览器伪装 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36' } session.headers.update(headers) # 第一步 获取登录页面,获取cookie login_page_url = 'https://kyfw.12306.cn/otn/login/init' session.get(login_page_url) # print(session.cookies) # 第二步 下载验证码图片 captcha_url = 'https://kyfw.12306.cn/passport/captcha/captcha-image?login_site=E&module=login&rand=sjrand&%s' % str(random.random()) # requests 请求参数的构建 data = { 'login_site': 'E', 'module': 'login', 'rand': 'sjrand', str(random.random()): '' } # captcha_response = session.get(captcha_url, params=data) captcha_response = session.get(captcha_url) print(captcha_response.text) with open('captcha.jpg', 'wb') as f: f.write(captcha_response.content)
相关文章推荐
- python爬虫第二课:url解析
- 第二课 Python爬虫网络请求request模块详解
- Python爬虫第二课
- Python:黑板课爬虫闯关第二关
- 手写python爬虫第二弹
- python-GlidedSky爬虫闯关第二关
- Python学习笔记 第二部分 - 正则表达式 与 爬虫小实例(抓取豆瓣电影中评分大于等于8分的影片)
- python爬虫(4)四种方法通过黑板客第二关
- python爬虫——青大安全教育考试
- 【Python爬虫系列】Python 爬取搜房网二手房数据
- 手写python爬虫
- python爬虫爬取网络图片
- 学习笔记(02):150讲轻松搞定Python网络爬虫-爬虫开发工具安装
- Python 爬虫利器之 Pyppeteer 的用法
- python 爬虫 robots协议
- python爬虫之豆瓣电影评分
- Python3爬虫入门之pyquery库的使用
- python爬虫学习之路(5)--pyquery
- python爬虫——requests库
- python 爬虫 获取网页中的图片