您的位置:首页 > 编程语言 > Python开发

Python爬虫

2020-02-02 17:30 274 查看

【基于Anaconda Python爬虫】

看了很多大牛写的文章,稍微有点生涩,所以打算从今天开始每个月更新一点关于这两个月学习到各大网站的数据爬取,打算分为以下几部分:
  1. 关于爬虫我们需要了解相关协议 ,关注协议是假的,重要的是怎么去利用,达到用最短的时间找到我们想要的数据在哪里;
  2. 每一个爬虫的必经之路,简书的top10,在这里主要是讲讲一个爬虫的思路;
  3. **re,xpath,css强大的爬虫模块,**经过两个月的摧残,个人比较喜欢简单粗暴的re,(.*?)简直是美好的不行;
  4. ajax数据的爬取,现在异步加载的应用已经是烂大街了,不知道ajax数据的爬取和清洗,是一种罪;
  5. scrapy框架的搭建和初步认识让爬取变得更简单;
  6. scrapy框架的使用
最后小弟的知识有限,欢迎各位大佬指导,对抓包,逆向,反爬都是比较感兴趣,小弟的主业是java,Python是个意外,但是最近打算学学Django,欢迎各位打扰
  • 点赞
  • 收藏
  • 分享
  • 文章举报
someaure 发布了4 篇原创文章 · 获赞 0 · 访问量 299 私信 关注
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: