您的位置：首页 > 编程语言 > Python开发

python初级实战系列教程《一、爬虫之爬取网页、图片、音视频》

2018-03-02 00:23 951 查看

python基础知识可以到廖雪峰大佬的官网学习哦！

廖雪峰官网网址

学完python就开始我们的实战吧！首先我们就来学习下python爬虫

学习Python爬虫，先是介绍一个最容易上手的库urllib，非常适合学习爬虫。

**

1、爬取网页

import urllib.request
#爬取百度网页html
baidu_url = "http://www.baidu.com"
result = urllib.request.urlopen(baidu_url)
#读取
html = result .read()
#解码并打印出来
print(html.decode('utf-8'))

# url中包含汉字是不符合URL标准的，需要进行编码
# 编码后：http%3A//www.%E7%88%AC%E8%99%AB.com
urllib.request.quote('http://www.爬虫.com')

# 解码后：http://www.爬虫.com
urllib.request.unquote('http%3A//www.%E7%88%AC%E8%99%AB.com')

2、爬取二进制文件

**

1）爬取图片

import urllib.request
#图片url，我们百度首页logo下载下来
picture_url = "https://www.baidu.com/img/bd_logo1.png"
result = urllib.request.urlopen(picture_url)
picture = result.read()
#创建图片文件
with open("baidu_logo.png", "wb") as f:
#写入二进制数据
f.write(picture)

2）爬取音频

import urllib.request
#歌曲url，我们就下载一首王力宏的改变世界吧
audio_url = "http://m10.music.126.net/20180302001718/2da3721ebef7f851cf8e39a9ebe30327/ymusic/cd72/f24d/bd25/ccd471214e64e65f541297a7bdf1cd62.mp3"
result = urllib.request.urlopen(audio_url)
audio = result.read()
#创建mp3文件
with open("change_word.mp3", "wb") as f:
#写入二进制数据
f.write(audio)

顺便告诉大家一个获得音乐下载链接的方法，以后想听什么歌都可以免费下载了

3）爬取视频

import urllib.request
#视频url,就下载下人人车的广告视频吧（因为它比较小）
video_url = "http://113.113.73.41/r/baiducdngdct.inter.iqiyi.com/videos/other/20180212/07/5c/8747c90718618294a6d122f6b02ee090.f4v"
result = urllib.request.urlopen(video_url)
video = result.read()
#创建视频文件
with open("ad.f4v", "wb") as f:
#写入二进制数据
f.write(video)

今天就到这吧，是不是很简单呀！哈哈…

如果觉得对您有帮助

我，秦始皇，打赏！

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航