利用 WebClient 实现下载并另存为txt 格式的文本文件
2010-08-07 18:08
288 查看
前几天看到同事在网上复制、粘贴管理方面的文章,一遍一遍地重复,这让我想到可不可写一个程序来完成呢,于是上网查资料,终于给他解决了,代码如下:
等待更新...
using System; using System.Collections.Generic; using System.Linq; using System.Web; using System.Web.UI; using System.Web.UI.WebControls; using System.Text.RegularExpressions; using System.IO; using System.Text; namespace WebUI { public partial class TestWebClient : System.Web.UI.Page { protected void Page_Load(object sender, EventArgs e) { } protected void btnDownLoad_Click(object sender, EventArgs e) { for (int i = 1507; i <= 1507; i++) { string url = "http://www.ccmcsz.com/management/" + i + ".htm"; Response.Write(url); SetLog(url, i.ToString()); Response.Write("<br/>"); } } public void SetLog(string url, string name) { try { string filepath = @"D:\Test163\"; Encoding defaultencode = Encoding.GetEncoding("gb2312"); string FileName = name + ".txt"; string NewFilePath = Path.Combine(filepath, FileName); if (!Directory.Exists(filepath)) { Directory.CreateDirectory(filepath); } System.Net.WebClient wc = new System.Net.WebClient(); Stream ss = wc.OpenRead(url); StreamReader rd = new StreamReader(ss, defaultencode); string message = rd.ReadToEnd(); rd.Close(); wc.Dispose(); message = DelHTML(message); StreamWriter Sw = new StreamWriter(NewFilePath, true, defaultencode); Sw.Write(message); Sw.Flush(); Sw.Close(); Sw = null; } catch { this.Response.Write(url + "<br/>"); } } public static string DelHTML(string Htmlstring) { //删除脚本 Htmlstring = Regex.Replace(Htmlstring, @"([\r\n])[\s]+", "", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"<script[^>]*?>.*?</script>", "", RegexOptions.IgnoreCase); //删除HTML Htmlstring = Regex.Replace(Htmlstring, @"<(.[^>]*)>", "", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"([\r\n])[\s]+", "", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"-->", "", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"<!--.*", "", RegexOptions.IgnoreCase); //Htmlstring = Regex.Replace(Htmlstring,@"<A>.*</A>",""); //Htmlstring = Regex.Replace(Htmlstring,@"<[a-zA-Z]*=\.[a-zA-Z]*\?[a-zA-Z]+=\d&\w=%[a-zA-Z]*|[A-Z0-9]",""); Htmlstring = Regex.Replace(Htmlstring, @"&(quot|#34);", "\"", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&(amp|#38);", "&", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&(lt|#60);", "<", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&(gt|#62);", ">", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&(nbsp|#160);", " ", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&(iexcl|#161);", "\xa1", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&(cent|#162);", "\xa2", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&(pound|#163);", "\xa3", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"&(copy|#169);", "\xa9", RegexOptions.IgnoreCase); Htmlstring = Regex.Replace(Htmlstring, @"(\d+);", "", RegexOptions.IgnoreCase); Htmlstring.Replace("<", ""); Htmlstring.Replace(">", ""); Htmlstring.Replace("\r\n", ""); //Htmlstring=HttpContext.Current.Server.HtmlEncode(Htmlstring).Trim(); return Htmlstring; } } }
等待更新...
相关文章推荐
- 如何利用C/C++逐行读取txt文件中的字符串(可以顺便实现文本文件的复制)
- 如何利用C/C++逐行读取txt文件中的字符串(可以顺便实现文本文件的复制)
- 如何利用C/C++逐行读取txt文件中的字符串(可以顺便实现文本文件的复制)
- C#利用WebClient实现两种方式下载文件
- WebClient实现下载txt文件并与用户输入进行匹配 WebClient实现用户序列号验证 txt文件在服务器端密文存储 RSA解密加密
- java利用joup,imageio,base64来实现简历下载为html格式。
- 利用JS实现常用格式文件下载
- 如何利用C/C++逐行读取txt文件中的字符串(可以顺便实现文本文件的复制)
- 如何利用C/C++逐行读取txt文件中的字符串(可以顺便实现文本文件的复制)
- 如何利用C/C++逐行读取txt文件中的字符串(可以顺便实现文本文件的复制)
- 完成用户数据的导出,生成文本文件Users.txt,实现点击按钮自动下载
- 用PHP实现浏览器点击下载各种格式文档的方法详解【txt apk等等】
- iOS- 利用AFNetworking(AFN) - 实现文件断点下载
- jacob 实现Office Word文件格式转换 docTotxt,docTopdf,docxTodoc,pdfTotxt ...
- 利用AsyncTast实现图片下载
- QTP中实现对文本文件(txt)的读写操作
- 基于asp.net + easyui框架,js实现上传图片之前判断图片格式,同时实现预览,兼容各种浏览器+下载
- Framework7中利用download和external实现a标签下载文件和图片
- 利用WebService实现远程服务器文件的上传和下载
- 浅谈利用jspsmart实现文件上传下载(转)