您的位置:首页 > 其它

用正则表达式自动下载网页中的图片

2009-07-24 16:31 239 查看
首先获得网页的Html代码,然后用正则表达式分析其中图片的下载地址,最后自动逐个下载。

using System.Net;

private void DownloadImage()

private void ParseHtml(string content, string prefix, string expression, Collection<string> address, Collection<string> name)
alt="" src="/docfile/dyn/12345678LANGCCCCDDDDEEEEEEEERT09">BMW 3-series</dt>\par
alt="" src="/docfile/dyn/12345678LANGCCCCDDDDEEEEEEEEEE01">Toyota</dt>\par
alt="" src="/docfile/dyn/12345678LANGCCCCDDDDEEEEEEEEJY25">Polo cross</dt>\par
alt="" src="/docfile/dyn/12345678LANGCCCCDDDDEEEEEEEEMO02">Golf 4.5</dt>\par
要用正则表达式从中获得图片下载地址(例如:/docfile/dyn/12345678LANGCCCCDDDDEEEEEEEERT09)和图片名称(例如:BMW 3-series)

正则表达式部分如下:

@"/docfile/dyn/(?<Uri>[^""]*?)"">(?<Name>[^<]*?)</dt>"
注意其中group的用法(? *?),和引号的匹配用法,匹配双引号前面需要再带一个双引号。其中Uri这个group在dyn/后面,直到双引号结束;后面跟随着双引号和>,然后就是Name这个group;它以<号结束,最后跟随</dt>。

本文引用于:http://www.cnblogs.com/Mainz/articles/1087460.html
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: