提取网页中的javascript脚本和下载链接
2012-11-04 20:29
239 查看
网上有个不错的视频教程,是swf格式的,想下载下来,但是网页太多了,每次打开网页查看源码再定位到那么JavaScript块,复制粘贴,好不繁琐。于是就想通过程序来减少工作量。
程序功能:批量提取网页中的Javascript脚本,提取脚本中的视频下载链接信息。
首先通过网络请求网页,得到响应的流文件,通过正则表达式匹配提取其中的JavaScript脚本块。再匹配提出Url下载链接。
程序功能:批量提取网页中的Javascript脚本,提取脚本中的视频下载链接信息。
首先通过网络请求网页,得到响应的流文件,通过正则表达式匹配提取其中的JavaScript脚本块。再匹配提出Url下载链接。
using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.Linq; using System.Text; using System.Windows.Forms; using System.Net; using System.IO; using System.Text.RegularExpressions; namespace CsWebBrower { public partial class GetUri : Form { public GetUri() { InitializeComponent(); } private void button1_Click(object sender, EventArgs e) { string[] strs = textBox1.Lines; foreach (string str in strs) { Uri uri = new Uri(str); WebRequest req = WebRequest.Create(uri); WebResponse result = req.GetResponse(); Stream ReceiveStream = result.GetResponseStream(); StreamReader readerOfStream = new StreamReader(ReceiveStream, System.Text.Encoding.GetEncoding("UTF-8")); string temp = readerOfStream.ReadToEnd(); //Regex ex = new Regex("<script.+?type ?= ?(/\"|')text/javascript(/\"|')>.*?</script>", //RegexOptions.Singleline); MatchCollection mc = Regex.Matches(temp, @"<script[^>]*>[\s\S]*?</script>", RegexOptions.IgnoreCase); foreach (Match m in mc) { //MatchCollection mc2 = Regex.Matches(m.Value, @"http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)?", RegexOptions.IgnoreCase);[a-zA-z]+://[^\s]* MatchCollection mc2 = Regex.Matches(m.Value, @"http://[\s\S]*?.swf", RegexOptions.IgnoreCase); foreach (Match m2 in mc2) { richTextBox1.Text += m2.Value + "\n\n"; } } readerOfStream.Close(); ReceiveStream.Close(); } } } }
相关文章推荐
- 提供一段JavaScript脚本以辅助迅雷下载页面中的所有pdf文件链接
- Python小脚本 002 批量下载网页链接中的图片
- JavaScript 脚本下载解释执行阻塞页面优化
- 25个下拉网页菜单特效Javascript脚本
- inno 程序安装脚本,检测.net framework 环境并提供.net 2.0sp2下载链接
- JavaScript脚本可以放在网页的head里或者body部分,而且效果也不相同。
- 如何提取网页中所有链接
- 【搜索引擎Jediael开发笔记3】使用HtmlParser提取网页中的链接
- 一个检测网页是否有日常链接的python脚本
- 一个禁止右键、选择、拖曳、清空剪切板、禁止网页另存为的实用JavaScript脚本
- 使用Python中的HTMLParser、cookielib抓取和解析网页、从HTML文档中提取链接、图像、文本、Cookies(二)
- 通过JavaScript脚本来实现网页视频聊天室的快速制作
- 55个常用的JavaScript网页脚本
- 一个下载网页图片的shell脚本
- javascript onclick跳转链接网页
- iOS 网址、链接、网页地址、下载链接等正则验证
- javaScript基础---(一):如何在网页中实现javaScript脚本语言
- html网页中使用javascript脚本调用xml文档实例
- 全栈工程师之路(二)—— JavaScript(网页前端脚本语言)