您的位置:首页 > 编程语言 > Python开发

python初级实战系列教程《一、爬虫之爬取网页、图片、音视频》

2018-03-02 00:23 951 查看
python基础知识可以到廖雪峰大佬的官网学习哦!

廖雪峰官网网址

学完python就开始我们的实战吧!首先我们就来学习下python爬虫

学习Python爬虫,先是介绍一个最容易上手的库urllib,非常适合学习爬虫。

**

1、爬取网页

**

import urllib.request
#爬取百度网页html
baidu_url = "http://www.baidu.com"
result = urllib.request.urlopen(baidu_url)
#读取
html = result .read()
#解码并打印出来
print(html.decode('utf-8'))

# url中包含汉字是不符合URL标准的,需要进行编码
# 编码后:http%3A//www.%E7%88%AC%E8%99%AB.com
urllib.request.quote('http://www.爬虫.com')

# 解码后:http://www.爬虫.com
urllib.request.unquote('http%3A//www.%E7%88%AC%E8%99%AB.com')


**

2、爬取二进制文件

**

1)爬取图片

import urllib.request
#图片url,我们百度首页logo下载下来
picture_url = "https://www.baidu.com/img/bd_logo1.png"
result = urllib.request.urlopen(picture_url)
picture = result.read()
#创建图片文件
with open("baidu_logo.png", "wb") as f:
#写入二进制数据
f.write(picture)


2)爬取音频

import urllib.request
#歌曲url,我们就下载一首王力宏的改变世界吧
audio_url = "http://m10.music.126.net/20180302001718/2da3721ebef7f851cf8e39a9ebe30327/ymusic/cd72/f24d/bd25/ccd471214e64e65f541297a7bdf1cd62.mp3"
result = urllib.request.urlopen(audio_url)
audio = result.read()
#创建mp3文件
with open("change_word.mp3", "wb") as f:
#写入二进制数据
f.write(audio)


顺便告诉大家一个获得音乐下载链接的方法,以后想听什么歌都可以免费下载了



3)爬取视频

import urllib.request
#视频url,就下载下人人车的广告视频吧(因为它比较小)
video_url = "http://113.113.73.41/r/baiducdngdct.inter.iqiyi.com/videos/other/20180212/07/5c/8747c90718618294a6d122f6b02ee090.f4v"
result = urllib.request.urlopen(video_url)
video = result.read()
#创建视频文件
with open("ad.f4v", "wb") as f:
#写入二进制数据
f.write(video)


今天就到这吧,是不是很简单呀!哈哈…

如果觉得对您有帮助

我,秦始皇,打赏!



内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: