微信文章抓取
2017-08-16 09:48
162 查看
<?php class Wxarticle { /** * * 解析文章内容并组织返回参数 * */ public function parseArticle($url){ $con = file_get_contents($url); //正则表达式分为标题和内容 $title_preg = '|<title>(.*)</title>|iUs'; $content_preg = '|<div class="rich_media_content " id="js_content">(.*)</div>|iUs'; $img_preg = '|msg_cdn_url = "(.*)";|iUs'; $soure_preg = '|<span class="rich_media_meta rich_media_meta_text rich_media_meta_nickname">(.*)</span>|iUs'; preg_match($title_preg,$con,$title_arr);//获取标题 preg_match($img_preg,$con,$img_arr);//获取缩略图 preg_match($content_preg,$con,$content_arr);//获取文章主体 $preg_img="#<img.*src=\"(.*)\".*/>#iUs"; preg_match_all($preg_img, $content_arr[1],$arr_img); // 组织返回参数 $data = array(); $data['title'] = str_replace(' ',' ',$title_arr[1]); $data['thumbnail']= $this->qiniu($img_arr[1]) ? $this->qiniu($img_arr[1]) : ''; $data['content'] = trim($this->getContent($arr_img[1],$content_arr[1])); return $data['title'] && $data['content'] ? $data : array(); } /** * * 替换文章正文图片并返回正文主体 * */ protected function getContent($arr_img,$content){ foreach ($arr_img as $v){ $img = $this->qiniu($v); $content = str_replace('data-src="'.$v.'"','src="'.$img.'"',$content); } return $content; } /** * * 七牛图片上传 * */ protected function qiniu($url){ //微信文章图片有防盗链我想大家应该都是知道的,建议将匹配出来的图片传到七牛或者其他云服务 } }
相关文章推荐
- asp.net mvc抓取微信文章里面所有的图片
- 分享自动抓取缩略图相关文章(微信也有效)
- 微信文章抓取接口
- 如何抓取微信公共帐号发布的文章的阅读数和赞数
- nodejs爬虫-通过抓取搜狗微信网站获取微信文章信息
- [Python爬虫] 之十五:Selenium +phantomjs根据微信公众号抓取微信文章
- 抓取微信文章笔记
- 实时抓取采集微信文章
- php抓取微信文章图片保存到本地
- nodejs爬虫抓取搜狗微信文章详解
- 【java】微信文章抓取
- 根据微信号来抓取微信文章
- asp.net MVC 抓取微信文章数据(正文)
- 从这3点中看如何靠微信文章引爆朋友圈?
- 【学习】06 爬虫使用代理地址爬取搜狗微信文章
- Android仿微信文章悬浮窗效果的实现代码
- 如何查看微信公众号的历史文章(微信订阅号查看历史消息)
- 今日头条、微信写出阅读量十万+的文章核心技巧解密!
- 微信文章转发到wordpress的php实现
- 如何写一篇阅读100000+的微信文章?