蜘蛛中可以用到的正则收集
2006-04-03 09:00
253 查看
1,得到网页上的链接地址:
string matchString = @"<a[^>]+href=\s*(?:'(?<href>[^']+)'|""(?<href>[^""]+)""|(?<href>[^>\s]+))\s*[^>]*>";
2,得到网页的标题:
string matchString = @"<title>(?<title>.*)</title>";
3,去掉网页中的所有的html标记:
string temp = Regex.Replace(html, "<[^>]*>", ""); //html是一个要去除html标记的文档
4, string matchString = @"<title>([\S\s\t]*?)</title>";
5,js去掉所有html标记的函数:
function delHtmlTag(str)
{
return str.replace(/<\/?.+?>/g,"");//去掉所有的html标记
}
这个可能IE5会错,那用这个,梅花的:
function delHtmlTag(str)
{
return str.replace(/<[^>]+>/g,"");//去掉所有的html标记
}
string matchString = @"<a[^>]+href=\s*(?:'(?<href>[^']+)'|""(?<href>[^""]+)""|(?<href>[^>\s]+))\s*[^>]*>";
2,得到网页的标题:
string matchString = @"<title>(?<title>.*)</title>";
3,去掉网页中的所有的html标记:
string temp = Regex.Replace(html, "<[^>]*>", ""); //html是一个要去除html标记的文档
4, string matchString = @"<title>([\S\s\t]*?)</title>";
5,js去掉所有html标记的函数:
function delHtmlTag(str)
{
return str.replace(/<\/?.+?>/g,"");//去掉所有的html标记
}
这个可能IE5会错,那用这个,梅花的:
function delHtmlTag(str)
{
return str.replace(/<[^>]+>/g,"");//去掉所有的html标记
}
相关文章推荐
- 蜘蛛中可以用到的正则收集
- 蜘蛛中可以用到的正则收集
- 几个可以用到的正则表达式
- 蜘蛛中可能会用到的正则
- java版的webservice,完全用java的正则表达式对websercice的xml进行解析,可以很快用到web中,只需要调用其中的封装好的方法
- 收集各种 iOS App 开发可以用到的代码示例
- 收集各种 iOS App 开发可以用到的代码示例
- 收集各种 iOS App 开发可以用到的代码示例
- 收集起来的一些常用的正则验证
- AS3 常用正则表达式的总结-不用google了,我帮收集的很多了
- 可能用到的正则表达式
- 正则表达式收集
- 最常用的PHP正则表达式收集整理
- 常用正则表达式收集&勘误
- 转 常用C#正则表达式收集。
- sql语句语法介绍全记录,好东西,备用(用到的时候不会可以来查一下!)
- 写一个system.data.entity的simpledatarepo,实现crudq这些功能,不需要引入entityframework,直接可以使用,用到objectset
- 新发现:原来java正则表达式不写^和$也可以运行
- 这里主要收集各种用到的库,会不定期更新
- web页面html中常用的特殊符号大全-可以直接用到页面里