怎么用正则表达式获取文章内容中的<img标签和 src的路径
2015-07-14 11:51
796 查看
正则:
查找Img标签开头的图片路径
[iI][mM][gG][\s]*[sS][rR][cC][\s]*=[\s'"]*(?<ref_value>.*?(\.gif|\.jpg|\.png))
查找Function中的图片路径
[a-zA-Z_][a-zA-Z0-9_]+[\s]*\([^)]+?('|")(?<ref_value>[a-zA-Z0-9/\\-_\.]+?(\.gif|\.jpg|\.png))('|")[^)]*\)
查找background标签的图片路径
background="(?<ref_value>[^"]+)
查找URL的图片路径
:[\s]*url[\s]*\([\s"']*(?<ref_value>["']*[^)]+)
通用的:
("|')(?<ref_value>[^"']+?(\.gif|\.png|\.jpg))("|')
url\(['\"]?\s*(?<ref_value>[^>]+?)['\"]?\s*\)
Cimg[\d+]*[\s]*\([\s"']*(?<ref_value>[^"')]+)
private IList<string> MatchImgPath(string content, string regexPattern)
{
IList<string> _ret = new List<string>();
Regex reg = new Regex(regexPattern);
string _imgPath = "";
MatchCollection mc = reg.Matches(content);
if (mc != null && mc.Count > 0)
{
foreach (Match match in mc)
{
if (match.Success == false || match.Value == null || match.Value == "")
continue;
foreach (string name in reg.GetGroupNames())
{
if (name == null || name == "" || name == "0")
continue;
if (name == "ref_value"
&& match.Groups[name].Value != null
&& match.Groups[name].Value != "")
{
_imgPath = match.Groups[name].Value;
if(!_ret.Contains(_imgPath.ToLower()))
_ret.Add(_imgPath.ToLower());
}
}
}
}
return _ret;
}
查找Img标签开头的图片路径
[iI][mM][gG][\s]*[sS][rR][cC][\s]*=[\s'"]*(?<ref_value>.*?(\.gif|\.jpg|\.png))
查找Function中的图片路径
[a-zA-Z_][a-zA-Z0-9_]+[\s]*\([^)]+?('|")(?<ref_value>[a-zA-Z0-9/\\-_\.]+?(\.gif|\.jpg|\.png))('|")[^)]*\)
查找background标签的图片路径
background="(?<ref_value>[^"]+)
查找URL的图片路径
:[\s]*url[\s]*\([\s"']*(?<ref_value>["']*[^)]+)
通用的:
("|')(?<ref_value>[^"']+?(\.gif|\.png|\.jpg))("|')
url\(['\"]?\s*(?<ref_value>[^>]+?)['\"]?\s*\)
Cimg[\d+]*[\s]*\([\s"']*(?<ref_value>[^"')]+)
private IList<string> MatchImgPath(string content, string regexPattern)
{
IList<string> _ret = new List<string>();
Regex reg = new Regex(regexPattern);
string _imgPath = "";
MatchCollection mc = reg.Matches(content);
if (mc != null && mc.Count > 0)
{
foreach (Match match in mc)
{
if (match.Success == false || match.Value == null || match.Value == "")
continue;
foreach (string name in reg.GetGroupNames())
{
if (name == null || name == "" || name == "0")
continue;
if (name == "ref_value"
&& match.Groups[name].Value != null
&& match.Groups[name].Value != "")
{
_imgPath = match.Groups[name].Value;
if(!_ret.Contains(_imgPath.ToLower()))
_ret.Add(_imgPath.ToLower());
}
}
}
}
return _ret;
}
相关文章推荐
- ecshop ajax无刷新登陆
- Ecshop ajax 局部刷新购物车功能
- 我的网店 我做主
- remove-duplicates-from-sorted-array
- Android:控件AutoCompleteTextView 自动提示
- Unity创建prefab与实例化
- spring 基础知识复习
- 我们一起学习WCF 第五篇数据协定和消息协定
- 前端工作面试问题
- git 创建一个新分支,并将一个分支内容复制给创建的新分支
- GRE写作必备句型
- Android 中对话框的使用
- android官方侧滑菜单DrawerLayout详解
- 未来淘宝网的发展前景将会如何?
- ecshop lbi插入lbi 的写法
- 如何正确使用jQuery代码
- JQuery 学习笔记之:美妙的标题提示 弹出层
- W3C CSS验证器 和 HTML验证器
- ecshop 开发小结二
- ecshop 开发小结二