分享原创python爬取微信公众号,并分享GITHUB地址
2017-05-26 17:33
344 查看
爬取搜狗微信保存mysql
创建人:紫气东来
因为工作中用到抓取微信与内外部网站进行同步,所以编写了此程序。
程序思路:用selenium模拟手机登陆,下载对应HTML,再用BeautifulSoup解析html,存放mysql
程序构建在py3.x基础上,可以优化为爬虫程序。
代码地址:https://github.com/xocom/readwx
一:使用说明
1:程序使用了selenium,所以必须先安装chrome浏览器对应插件。
插件下载地址:https://sites.google.com/a/chromium.org/chromedriver/downloads
下载对应版本的EXE文件后,拷贝到chrome浏览器的目录,比如:C:\Program Files (x86)\Google\Chrome\Application
V56-V57版本的chrome可以直接用plugin下的chromedriver
2:建立表结构之后,修改运行test.py,数据会抓取到对应表。
创建人:紫气东来
因为工作中用到抓取微信与内外部网站进行同步,所以编写了此程序。
程序思路:用selenium模拟手机登陆,下载对应HTML,再用BeautifulSoup解析html,存放mysql
程序构建在py3.x基础上,可以优化为爬虫程序。
代码地址:https://github.com/xocom/readwx
一:使用说明
1:程序使用了selenium,所以必须先安装chrome浏览器对应插件。
插件下载地址:https://sites.google.com/a/chromium.org/chromedriver/downloads
下载对应版本的EXE文件后,拷贝到chrome浏览器的目录,比如:C:\Program Files (x86)\Google\Chrome\Application
V56-V57版本的chrome可以直接用plugin下的chromedriver
2:建立表结构之后,修改运行test.py,数据会抓取到对应表。
相关文章推荐
- 分享一个连接,python扩展包下载地址分享包括numpy,scipy等,解决了win8系统不能使用这些扩展包的问题!
- python和shell实现的校验IP地址合法性脚本分享
- 分享个python学习地址
- 【原创】分享一个Python爬虫源码|爬虫批量爬取图片
- 基于python语言的tensorflow的‘端到端’的字符型验证码识别源码整理(github源码分享)
- python和shell实现的校验IP地址合法性脚本分享
- 资源分享_Django.GitHub Python网页框架Django资源集合
- 【原创分享】python获取乌云最新提交的漏洞,邮件发送
- 微信公众号分享与收货地址功能详解
- 【原创】用Python爬取LeetCode的AC代码到Github
- python爬虫实现----github地址
- 资源分享_Tornado.GitHub Python网页框架Tornado资源集合
- 微信公众号一次二次转发链接地址是IP和图片不显示,转换成文字和图片分享到朋友圈问题
- 分享一个python cookbook的在线教程地址
- 原创:老司机为教老婆学Python,星期天用Python写了一个俄罗斯方块程序。现在分享给大家,供大家闲暇时娱乐。
- [更新Github地址]python学习,自己写了个简单聊天工具mychat
- 分享一些不错的github地址
- 微信公众号再出原创保护新招“转载”变“分享”
- 资源分享_Flask.GitHub Python网页框架Flask资源集合
- [原创]思维导图工具介绍及下载地址