网络爬虫,python和数据分析学习--part3
2017-10-10 17:14
183 查看
# -- coding: utf-8 --
“””
Created on Tue Oct 10 10:59:56 2017
本段程序为科大王澎老师《网络爬虫,python和数据分析》中P15,针对spyder3做了微调
主要任务:解决了中文乱码问题
@author:
“””
import re
import urllib.request
import pymysql
from bs4 import BeautifulSoup
import time #延时用,如果不延时,可以不加
aaa = 3640
url1=’http://bbs.ustc.edu.cn/cgi/bbstdoc?board=PieBridge&start=’
while aaa>0:
time.sleep(1)#延时,为的是环节被爬网站的压力
aaa=aaa-20#网站link有规律,每页递减20,利用该规律设置每次赋入的URL,爬完所有贴
aaa1=str(aaa)
url1=url1+aaa1
fp=urllib.request.urlopen(url1)
try:
s=fp.read().decode(‘gb2312’,’ignore’)#把gb2312改为网页编码
#下面修改网页内容s的编码设置
s=re.sub(‘charset=gb2312’,’charset=gb2312=utf-8’,s,re.I)
s=s.encode(‘utf-8’,’ignore’)
except:
s=fp.read()
soup=BeautifulSoup(s)
polist=soup.findAll(‘span’)
print (polist[0].contents[0])
“””
Created on Tue Oct 10 10:59:56 2017
本段程序为科大王澎老师《网络爬虫,python和数据分析》中P15,针对spyder3做了微调
主要任务:解决了中文乱码问题
@author:
“””
import re
import urllib.request
import pymysql
from bs4 import BeautifulSoup
import time #延时用,如果不延时,可以不加
aaa = 3640
url1=’http://bbs.ustc.edu.cn/cgi/bbstdoc?board=PieBridge&start=’
while aaa>0:
time.sleep(1)#延时,为的是环节被爬网站的压力
aaa=aaa-20#网站link有规律,每页递减20,利用该规律设置每次赋入的URL,爬完所有贴
aaa1=str(aaa)
url1=url1+aaa1
fp=urllib.request.urlopen(url1)
try:
s=fp.read().decode(‘gb2312’,’ignore’)#把gb2312改为网页编码
#下面修改网页内容s的编码设置
s=re.sub(‘charset=gb2312’,’charset=gb2312=utf-8’,s,re.I)
s=s.encode(‘utf-8’,’ignore’)
except:
s=fp.read()
soup=BeautifulSoup(s)
polist=soup.findAll(‘span’)
print (polist[0].contents[0])
相关文章推荐
- 网络爬虫,python和数据分析学习--part2
- 网络爬虫,python和数据分析学习--part1
- 【Python数据分析】Python3多线程并发网络爬虫-以豆瓣图书Top250为例
- 零基础学习Python数据分析
- Python 数据分析(一) 本实验将学习 pandas 基础,数据加载、存储与文件格式,数据规整化,绘图和可视化的知识
- 【利用python进行数据分析-学习记录】python-matplotlib中Basemap插件的安装
- 《利用Python进行数据分析: Python for Data Analysis 》学习随笔
- python学习-文本数据分析1(主题提取+词向量化)
- 利用python进行数据分析(学习笔记)
- python数据分析与挖掘学习笔记(1)-基础及准备
- python数据分析入门学习笔记
- python数据分析与挖掘学习笔记(2)-淘宝商品数据清洗及预处理
- python学习、数据收集、数据分析
- 用data.DataReader读取股价数据并分析--python学习笔记17
- Python数据分析之numpy学习
- Python & 数据分析学习笔记[第1篇]
- Python 数据分析(二 本实验将学习利用 Python 数据聚合与分组运算,时间序列,金融与经济数据应用等相关知识
- Python数据分析之pandas学习
- 快速学习 Python 数据分析包 之 pandas
- python数据分析pandas包入门学习(三)汇总和统计描述