Python学习笔记1——爬虫初识BeautifulSoup
2018-05-29 16:14
369 查看
在使用juputer爬虫之前先引入几个包
笔记参考代码是2017.5.20爬虫1
import pymysql
from bs4 import BeautifulSoupimport requests
import sqlite3
#sqilte3是python内置的数据库mysql读取模块
import pandas as pdfrom urllib.request import urlopen
#urlopen包request就是向网站发送请求,打开一个网页获取所有内容
引入你要抓取的网址赋给对象url
url = "网址.html"
html = urlopen(url) #将网址赋值给对象html
print (html.read()) #读取.html文件
演示html.read()和html.text区别,细小差别
相关文章推荐
- python 3 爬虫学习笔记(1) —— 初识BeautifulSoup
- python库学习笔记——爬虫常用的BeautifulSoup的介绍
- Python学习笔记初识beautifulsoup
- Python爬虫(入门+进阶)学习笔记 1-2 初识Python爬虫
- Python学习笔记(五十)爬虫的自我修养(三)爬取漂亮妹纸图
- [笔记]python爬虫学习笔记(一)——网页的获取和打印
- 【Python3.6爬虫学习记录】(二)使用BeautifulSoup爬取简单静态网页文章
- [Python]网络爬虫学习笔记,爬取豆瓣妹子上妹子的照片
- python学习笔记之网络爬虫(五)正则表达式
- Python源码学习笔记 · 初识
- 【学习笔记】Python爬虫-豆瓣电影所有短评
- python 3.0学习笔记之一------初识python
- python学习之爬虫:BeautifulSoup
- python学习笔记(类比C)---安装与初识python
- 【python学习笔记】24:scipy扩展库的安装与初识
- Python 爬虫学习笔记
- 【Python学习笔记(三)】:爬虫用到的知识点总结
- 【python学习笔记】7:用python实现爬虫-基础
- python爬虫:编写多进程爬虫学习笔记
- python爬虫学习笔记