Python 基础知识
2017-01-03 22:46
204 查看
1.# -- coding: utf-8 -这是用来说明你的Python源程序文件用使用的编码。缺省情况下你的程序需要使用ascii码来写,但如果在其中写中文的话,python解释器一般会报错,但如果加上你所用的文件编码,python就会自动处理不再报错。
上述格式还可以写成:
其中
URL管理器用来管理已爬和待爬的URL;
网页下载器接收URL后,进行网页下载;
网页解析器对于下载后的网页进行提取信息。
3.BeautifulSoup的简单使用
创建soup对象->搜索节点find_all(所有结点)、find(一个结点)->访问节点(名称,属性(href),文字)
ps:BeautifulSoup(html_doc,’html.parser’,from_encoding=’utf-8’)
上述格式还可以写成:
coding=utf-8
或coding:utf-8
2.爬虫的基本架构其中
URL管理器用来管理已爬和待爬的URL;
网页下载器接收URL后,进行网页下载;
网页解析器对于下载后的网页进行提取信息。
3.BeautifulSoup的简单使用
创建soup对象->搜索节点find_all(所有结点)、find(一个结点)->访问节点(名称,属性(href),文字)
ps:BeautifulSoup(html_doc,’html.parser’,from_encoding=’utf-8’)
相关文章推荐
- [Python]类的基础知识
- 适用于PHP开发人员的Python基础知识
- Python基础知识(五)--数据类型
- 适用于 PHP 开发人员的 Python 基础知识
- python基础知识(第一章)
- python模块之bsddb: bdb高性能嵌入式数据库 1.基础知识
- Python基础知识(四)--函数
- Python基础知识(七)--字符串详解
- Python基础知识(四)--函数
- Python基础知识(二)--控制流语句
- 学学python(1)一些基础知识点
- Python基础知识汇总
- python基础教程-第1章节 基础知识
- Python基础知识(一)
- Python基础知识(一)
- Python自学笔记(一)(Python基础知识)
- Python基础知识(二)--控制流语句
- Python入门:基础知识
- Python基础知识(八)--序列类型_元组
- Python基础知识(三)--基本的异常处理、算术运算符、输入/输出