您的位置:首页 > 其它

CSDN 博客备份工具

2019-01-20 10:16 176 查看

https://www.geek-share.com/detail/2704434788.html

 

Beautiful Soup

https://cuiqingcai.com/1319.html

 

https://www.cnblogs.com/forever-snow/p/8506746.html

 

第1步、解析网页
有四种解析方式:
(1)‘html.parser’解析 速度适中,容错能力强
(2)’lxml’解析 速度快,容错能力强
(3)’xml’解析 速度快,唯一支持xml的解析器
(4)’html5lib’解析 速度慢点,最好的容错性

 

https://www.geek-share.com/detail/2724563941.html

 

几种爬虫比较

  1. urllib+正则:无第三方依赖
  2. requests+BeautifulSoup:library
  3. scrapy:框架

 

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: