您的位置：首页 > 理论基础 > 计算机网络

python 网络数据采集——媒体文件

2016-09-29 23:23 495 查看

声名：本文为学习笔记，内容来自于《python 网络数据采集》（英文名：Web Scraping with Python)

存储媒体文件有两种主要方式：只获取URL链接，或者直接把源文件下载下来。如果，文件需要多次使用，那么最好下载下来。

以下载图片为例，在Python 3.x 版本中，urllib.request.urlretrieve可以根据文件的URL下载文件：

from urllib.request import urlretrieve
from urllib.request import urlopen
from bs4 import BeautifulSoup

html = urlopen("http://www.pythonscraping.com")
bsObj = BeautifulSoup(html)
imageLocation = bsObj.find("a", {"id": "logo"}).find("img")["src"]
urlretrieve(imageLocation, "logo.jpg")

这段程序是从http://pythonscraping.com下载logo图片，然后在程序运行的文件夹里保存为logo.jpg文件。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： python url 网络数据图片

相关文章推荐

新的分享

章节导航