用正则表达式自动下载网页中的图片
2009-07-24 16:31
239 查看
首先获得网页的Html代码,然后用正则表达式分析其中图片的下载地址,最后自动逐个下载。
using System.Net;
private void DownloadImage()
private void ParseHtml(string content, string prefix, string expression, Collection<string> address, Collection<string> name)
alt="" src="/docfile/dyn/12345678LANGCCCCDDDDEEEEEEEERT09">BMW 3-series</dt>\par
alt="" src="/docfile/dyn/12345678LANGCCCCDDDDEEEEEEEEEE01">Toyota</dt>\par
alt="" src="/docfile/dyn/12345678LANGCCCCDDDDEEEEEEEEJY25">Polo cross</dt>\par
alt="" src="/docfile/dyn/12345678LANGCCCCDDDDEEEEEEEEMO02">Golf 4.5</dt>\par
要用正则表达式从中获得图片下载地址(例如:/docfile/dyn/12345678LANGCCCCDDDDEEEEEEEERT09)和图片名称(例如:BMW 3-series)
正则表达式部分如下:
@"/docfile/dyn/(?<Uri>[^""]*?)"">(?<Name>[^<]*?)</dt>"
注意其中group的用法(? *?),和引号的匹配用法,匹配双引号前面需要再带一个双引号。其中Uri这个group在dyn/后面,直到双引号结束;后面跟随着双引号和>,然后就是Name这个group;它以<号结束,最后跟随</dt>。
本文引用于:http://www.cnblogs.com/Mainz/articles/1087460.html
using System.Net;
private void DownloadImage()
private void ParseHtml(string content, string prefix, string expression, Collection<string> address, Collection<string> name)
alt="" src="/docfile/dyn/12345678LANGCCCCDDDDEEEEEEEERT09">BMW 3-series</dt>\par
alt="" src="/docfile/dyn/12345678LANGCCCCDDDDEEEEEEEEEE01">Toyota</dt>\par
alt="" src="/docfile/dyn/12345678LANGCCCCDDDDEEEEEEEEJY25">Polo cross</dt>\par
alt="" src="/docfile/dyn/12345678LANGCCCCDDDDEEEEEEEEMO02">Golf 4.5</dt>\par
要用正则表达式从中获得图片下载地址(例如:/docfile/dyn/12345678LANGCCCCDDDDEEEEEEEERT09)和图片名称(例如:BMW 3-series)
正则表达式部分如下:
@"/docfile/dyn/(?<Uri>[^""]*?)"">(?<Name>[^<]*?)</dt>"
注意其中group的用法(? *?),和引号的匹配用法,匹配双引号前面需要再带一个双引号。其中Uri这个group在dyn/后面,直到双引号结束;后面跟随着双引号和>,然后就是Name这个group;它以<号结束,最后跟随</dt>。
本文引用于:http://www.cnblogs.com/Mainz/articles/1087460.html
相关文章推荐
- 用正则表达式自动下载网页中的图片
- 用正则表达式自动下载网页中的图片
- C#控制台基础 正则表达式,regex,webclient下载博客园网页中的一张图片
- 正则表达式获取网页中所有图片的路径
- C# 正则表达式抓取网页上某个标签的内容,并替换链接地址和图片地址
- 正则表达式,抓取网页所有图片
- 需求(Java);利用Jsoup架包获取指定网页的全部图片,并自动下载到指定文件夹中
- Python抓取网页&批量下载文件方法初探(正则表达式+BeautifulSoup)
- Python抓取网页&批量下载文件方法初探(正则表达式+BeautifulSoup) (转)
- 从指定网页自动下载其中所有的图片
- 自动下载网页中图片到服务器指定位置
- 用正则表达式采集网页上的图片信息
- 正则表达式匹配网页中的图片地址
- Python中运用正则表达式抓取网页图片
- Python 网络爬虫 009 (编程) 通过正则表达式来获取一个网页中的所有的URL链接,并下载这些URL链接的源代码
- 笨笨图片批量抓取下载 V0.2 beta[C# | WinForm | 正则表达式 | HttpWebRequest | Async异步编程]
- Python爬虫urllib2笔记(三)之使用正则表达式提取百度贴吧网页中的楼主发的图片
- PHP通过正则表达式获取网页中的所有图片
- ASP.NET正则表达式提取网页网址、标题、图片实例以及过滤所有HTML标签实例
- php中通过正则表达式下载内容中的远程图片的函数代码