python爬虫简单尝试
2017-10-28 18:59
381 查看
python爬虫简单尝试
主要是获取网页数据,然后分析网页数据,获取自己需要的数据
获取网页数据的方法有些不同在不同的python上
# import urllib.request # import urllib.parse import urllib from bs4 import BeautifulSoup def getHtml(url): # data=urllib.request.urlopen(url).read() # data_final=data.decode('utf-8') data_final=urllib.urlopen(url) return data_final
上面是python2.7的代码 ;注释掉的是python3.x的代码;
有一点要注意:两个版本是不兼容的。
上面获取到了数据,下面就是解析了,解释用到了BeautifulSoup,该模块的介绍网上有好多
def pa(): respone=getHtml("http://www.wanandroid.com/") soup=BeautifulSoup(respone, "html.parser") books=soup.find(attrs={"class":"main_content_l"}) # print books book_div=books.findAll('div',attrs={"class":"info_art"}) # print book_div[0] for book in book_div: book_name=book.span if book_name is not None: print book_name.string
上面解析的是鸿洋大神的玩Android网站(Android学习的好地方,推荐),只是简单的获取标签。
结语
后继会续深入的了解python,还有就是多看玩Android。相关文章推荐
- python尝试写简单爬虫
- python爬虫的一些简单尝试
- 简单地python爬虫尝试
- Python简单爬虫爬取自己博客园所有文章
- python 特别简单的一个小爬虫(看着玩吧 )
- python实现简单爬虫功能
- python3爬虫爬取网页图片简单示例
- python实现的一个简单的网页爬虫
- python简单爬虫笔记
- python简单爬虫,Beautifulsoup4解析,爬取直播吧部分热门新闻及链接
- python用BeautifulSoup库简单爬虫实例分析
- Python简单知乎爬虫--爬取页面的图片并下载到本地
- 最简单的python爬虫实战——爬取王者荣耀皮肤及头像
- Python爬虫的post请求简单实例
- Python 简单爬虫抓取糗事百科
- Python制作简单的网页爬虫
- python 实现简单爬虫
- Python 用Redis简单实现分布式爬虫的方法
- python爬虫(1)——简单的爬取网页的信息
- python实现简单爬虫功能