您的位置：首页 > 编程语言 > Python开发

Python爬虫实例（1）-爬取一张猫的照片

2017-12-12 19:00 176 查看

编程这种实用性的工程性语言，光看书、背概念是完全刻舟求剑；learning with doing才是最快速的学习方法。我打算将自己学习爬虫的周期，总结之后写在CSDN上；通过自己感觉非常经典的实例，来表达爬虫的知识点。话不多说，上一篇描述了爬虫的原理之后，这一篇搞第一个实例。

运行环境是Anaconda-Spyder，Python3.6，win7系统，亲测可运行。代码注释详细，对新手很友好。

第三方包的安装，见第二篇博客，此处不再赘述。

#表示使用utf-8编码格式，可以使用中文
# -*- coding: utf-8 -*- 

#本实例必要的包。requests包用于请求网页信息，os包用于调用当前操作系统的命令
import requests
import os

#在本地新建文件夹，命名为cat_img，用以保存下载的图片。具体语句的含义，可看代码猜测，也可百度方法的含义
folder = 'cat_img'
if not os.path.exists(folder):
    os.makedirs(folder)

#新建一个函数，命名为download，作用是从网页中图片对应的代码，将图片下载到本地，下载路径为上面的folder文件夹中
def download(url):
    response = requests.get(url, headers = header)
    name = url.split('/')[-1]
    f = open( folder + '/' + name + '.jpg', 'wb')
    f.write(response.content)
    f.close()
    return True

#网页的基本信息，包含网址url，和请求头header。这里的cat_url就是图片对应的网址，header的作用是防止反爬机制
cat_url = 'http://placekitten.com/450/1000'
header = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36'}

#执行图片下载函数download，下载图片
download(cat_url)
print('OK')
#运行完毕之后，可以查看本地，一张猫的图片已经下载到了//cat_img这个文件夹下

本例子十分简单，下载的图片只有一张。实际工作中，爬虫肯定不止这么简单。

本例涉及到的知识点：

1、requests包的基本使用，爬虫请求网页的方法；

2、新建函数的方法，以及下载图片的函数的写法；

3、用os包在本地电脑新建一个文件夹的方法；

4、headers请求头，网址url的定义

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航