您的位置:首页 > 移动开发 > 微信开发

分享原创python爬取微信公众号,并分享GITHUB地址

2017-05-26 17:33 344 查看
爬取搜狗微信保存mysql

创建人:紫气东来

因为工作中用到抓取微信与内外部网站进行同步,所以编写了此程序。

程序思路:用selenium模拟手机登陆,下载对应HTML,再用BeautifulSoup解析html,存放mysql

程序构建在py3.x基础上,可以优化为爬虫程序。



代码地址:https://github.com/xocom/readwx

一:使用说明

1:程序使用了selenium,所以必须先安装chrome浏览器对应插件。

  插件下载地址:https://sites.google.com/a/chromium.org/chromedriver/downloads

  下载对应版本的EXE文件后,拷贝到chrome浏览器的目录,比如:C:\Program Files (x86)\Google\Chrome\Application

  V56-V57版本的chrome可以直接用plugin下的chromedriver

2:建立表结构之后,修改运行test.py,数据会抓取到对应表。

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: