您的位置：首页 > 其它

蜘蛛中可以用到的正则收集

2006-04-03 09:00 253 查看

1，得到网页上的链接地址：
string matchString = @"<a[^>]+href=\s*(?:'(?<href>[^']+)'|""(?<href>[^""]+)""|(?<href>[^>\s]+))\s*[^>]*>";
2，得到网页的标题：
string matchString = @"<title>(?<title>.*)</title>";
3，去掉网页中的所有的html标记：
string temp = Regex.Replace(html, "<[^>]*>", ""); //html是一个要去除html标记的文档
4, string matchString = @"<title>([\S\s\t]*?)</title>";
5,js去掉所有html标记的函数：
function delHtmlTag(str)
{
return str.replace(/<\/?.+?>/g,"");//去掉所有的html标记
}
这个可能IE5会错，那用这个，梅花的：
function delHtmlTag(str)
{
return str.replace(/<[^>]+>/g,"");//去掉所有的html标记
}

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

蜘蛛中可以用到的正则收集
蜘蛛中可以用到的正则收集
几个可以用到的正则表达式
蜘蛛中可能会用到的正则
java版的webservice,完全用java的正则表达式对websercice的xml进行解析，可以很快用到web中，只需要调用其中的封装好的方法
收集各种 iOS App 开发可以用到的代码示例
收集各种 iOS App 开发可以用到的代码示例
收集各种 iOS App 开发可以用到的代码示例
收集起来的一些常用的正则验证
AS3 常用正则表达式的总结-不用google了，我帮收集的很多了
可能用到的正则表达式
正则表达式收集
最常用的PHP正则表达式收集整理
常用正则表达式收集&勘误
转常用C#正则表达式收集。
sql语句语法介绍全记录，好东西，备用（用到的时候不会可以来查一下！）
写一个system.data.entity的simpledatarepo，实现crudq这些功能，不需要引入entityframework,直接可以使用，用到objectset
新发现:原来java正则表达式不写^和$也可以运行
这里主要收集各种用到的库，会不定期更新
web页面html中常用的特殊符号大全-可以直接用到页面里

新的分享

一次教科书级别的Redis高可用架构设计实践 - Redis
曾光：北京这次的毒株不像国内流行类型
从PRD文档到产品上线，有哪些问题需要解决？
vue3自定义指令的使用
Oracle SQL性能优化最常用的40条建议 - ORACLE
程序员翻车常见反应，你中枪了吗？ - 职场生涯
新鲜开源：基于Prometheus的企业监控平台设计与实现 - 运维
嵌入式软件开发之程序架构设计-任务调度
【Java面试】请简单说一下你对受检异常和非受检异常的理解
奇安信更新招股书：第一季亏损过5亿，齐向东持股38%
艾瑞咨询：2020年中国后智能厨房案例研究报告
艾瑞咨询：2020年中国人工智能+物流发展研究报告

章节导航