您的位置:首页 > 编程语言 > PHP开发

php抓取网页特定div区块及图片

2018-01-10 10:51 323 查看

 
1. 取得指定网页內的所有图片:
<?php
取得指定位址的內容,並储存至text
$text=file_get_contents('http://yourweb/');

取得第一個img标签,並储存至阵列match(regex语法与上述同义)
preg_match('/<img[^>]*>/Ui', $text, $match);

印出match
print_r($match);

-----------------

2. 取得指定网页內的第一张图片:
<?php
取得指定位址的內容,並储存至text
$text=file_get_contents('http://yourweb/');

取得第一個img标签,並储存至阵列match(regex语法与上述同义)
preg_match('/<img[^>]*>/Ui', $text, $match);

印出match
print_r($match);

------------------------------------

3. 取得指定网页內的特定div区块(藉由id判断):
<?php
取得指定位址的內容,並储存至text
$text=file_get_contents('http://yourweb/');

去除換行及空白字元(序列化內容才需使用)
$text=str_replace(array("\r","\n","\t","\s"), '', $text);

取出div标签且id為PostContent的內容,並储存至阵列match
preg_match('/<div[^>]*id="PostContent"[^>]*>(.*?) <\/div>/si',$text,$match);

印出match[0]
print($match[0]);

-------------------------------------------

4. 上述2及3的结合:
<?php
取得指定位址的內容,並储存至text
$text=file_get_contents('http://yourweb/');

取出div标签且id為PostContent的內容,並储存至阵列match
preg_match('/<div[^>]*id="PostContent"[^>]*>(.*?) <\/div>/si',$text,$match);

取得第一個img标签,並储存至阵列match2
preg_match('/<img[^>]*>/Ui', $match[0], $match2);

印出match2[0]
print_r($match2[0]);
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: