python_爬虫大学排行的代码
2017-07-02 22:34
393 查看
import requests from bs4 import BeautifulSoup import bs4 #1爬取网页 def GetHtml(url): try: r=requests.get(url,timeout=30) r.raise_for_status() r.encoding=r.apparent_encoding return r.text except: return "异常" #2提取内容、 def FullList(html,ulist): soup= BeautifulSoup(html,'html.parser') for temp in soup.find('tbody').children: if isinstance(temp,bs4.element.Tag): tds=temp('td') ulist.append([tds[0].string,tds[1].string,tds[2].string]) def printUnivlist(ulist,num): tplt = "{0:^10}\t{1:{3}^10}\t{2:^10}" print(tplt.format("排名", "学校名称", "总分", chr(12288))) for i in range(num): u = ulist[i] print(tplt.format(u[0], u[1], u[2], chr(12288))) #3内容的输出 infos=[] url='http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html' html=GetHtml(url) FullList(html,infos) printUnivlist(infos,20)
相关文章推荐
- Python天气预报采集器实现代码(网页爬虫)
- 利用python脚本抓取AC的代码[爬虫+HTMLParser+handle_entityref+正则表达式+模拟登陆+文件操作]
- Python 实现网络爬虫 抓取静态网页【代码】
- python3.4学习笔记(十三) 网络爬虫实例代码,使用pyspider抓取多牛投资吧里面的文章信息,抓取政府网新闻内容
- Python爬虫实战三之计算大学本学期绩点
- python 网络爬虫代码
- Python爬虫实战(3):计算大学本学期绩点
- Python实现爬取知乎神回复简单爬虫代码分享
- 零基础写python爬虫之抓取糗事百科代码分享
- python-12:怎么在爬虫代码中伪装header
- Python天气预报采集器实现代码(网页爬虫)
- python3简单爬虫实现代码
- 一则python3的简单爬虫代码
- Python实现爬取知乎神回复简单爬虫代码分享
- 零基础写python爬虫之抓取糗事百科代码分享
- Python天气预报采集器实现代码(网页爬虫)
- 一则python3的简单爬虫代码
- python爬虫入门教程之糗百图片爬虫代码分享
- python网络爬虫——基本概念及代码实现1
- Python爬虫实战(3):计算大学本学期绩点