您的位置:首页 > 编程语言 > Python开发

python爬虫基础知识之requests,读取图片的两只方式,cookies,beautifulsoup

2017-12-12 16:53 846 查看
Requests

1.        

o  发送请求

o  传递URL参数

o  读取响应内容(文本/二进制/Json)

o  定制请求头部

o  Post请求

o  响应状态码

o  重定向和历史

o  超时

 

2.       处理二进制内容导入包

 

#抓取图片

from PIL import Image

#处理二进制内容

from io import BytesIO

 

3.       图片处理

1)       #二进制数据

r=requests.get('http://img.mshishang.com/pics/2016/1209/20161209125708793.jpeg')

image=Image.open(BytesIO(r.content))

image.save('shauige.jpg')

 

2)       #原始数据处理,还是处理图片的例子,利用流处理,效率高

r=requests.get('http://img.mshishang.com/pics/2016/1209/20161209125708793.jpeg',stream= True)

#w表示写,b表示二进制,+表示原来有的话删除掉

while open('shuaige2.jpg','wb+') as f:

for chunk inr.iter_content(1024):

f.write(chunk)

 

4.       提交表单and cookies  and 重定向

#提交表单

form={'username':'user','password':'pass'}

r=requests.get('http://httpbin.org/post',data=form)

print(r.text)

r=requests.post('http://httpbin.org/post',data=json.dumps)

print(r.text)

#cookie

url='http://www.baidu.com'

r=requests.get(url)

cookies=r.cookies

for k, v in cookies.get_dict().items():

print(k,v)



 

 

 

5.       Beautiful soup

soup=Beautifulsoup(open(url))

 
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐