您的位置:首页 > 编程语言 > Python开发

python爬虫学习day2-2.遇到js时发生的问题

2018-07-16 15:57 573 查看

学习视频链接:点击打开链接

笔记部分:

爬到评论数却无法获取到评论数量时,提出猜测是经过js增添上去,所以需要在页面中检查找出提供js的network js链接地址

(即提供js的公网http://链接)

取参考:




然后代码取出相关内容:



-------------------分割线---------------------------------

取出链接中指定位置的值


#取出链接中指定位置的值newsurl = 'http://comment5.news.sina.com.cn/comment/skin/cos-ai9885256.shtml'newsid = newsurl.split('/')[-1].rstrip('.shtml').lstrip('cos-ai')print(newsid)

运行结果为:9885256


理解:

newsid = newsurl

取出链接中指定位置的值之二:(使用正规表达法)




总结:



阅读更多
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: