您的位置:首页 > 理论基础 > 计算机网络

python本地与网络数据的获取

2017-12-12 20:06 211 查看

用python获取网络数据

网络数据如何获取(爬取)

抓取网页,解析网页内容

抓取

urllib内建模块

urllib.request

Requests第三方库

Scrapy框架—开源的第三方框架

某些网站爬虫协议提供robots.txt文件

解析

BeautifulSoup库

re模块

用python获取本地函数

(1)
open()
函数返回一个文件(file)对象

(2)文件对象可迭代

(3)有关闭和读写文件相关的函数方法

-
f.read(),f.write(),f.readline(),f.readlines(),f.writelines()


-
f.close(),f.seek()


推荐使用with语句来进行文件的读写以及异常的处理

readline()
读取一行数据

readlines()
读取多行数据

标准文件

当程序启动后,以下三种标准文件有效:

stdin
标准输入

stdout
标准输出

stderr
标准错误

print的实现方法

>>>import sys
>>>sys.stdout.write("hello")
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  python 数据