简单的解析文件,取URL地址,并根据地址抓下页面
2008-04-11 14:24
507 查看
/**
*
* 解析文件,取出URL地址
*
*/
public static void regexStr(){
String input="我想去这个网站http://www.handandaily.com问问题";
Pattern p = Pattern.compile("http://[*[a-zA-Z]|w{3}].*[a-zA-Z]");
Matcher m = p.matcher(input);
m.find();
String str=m.group();
System.out.print(str);
}
/**
* 根据URL,把网页保存到本地
* @param urlStr
* @param filename
* @return
*/
public static boolean getUrlToFileInputStream(String urlStr, String filename){
DataInputStream dataInputStream=null;
try{
URL url = new URL(urlStr);
URLConnection conn = url.openConnection();
dataInputStream = new DataInputStream(conn.getInputStream());
}catch(Exception e){
e.getMessage();
}
DataOutputStream dataoutputstream = null;
if(dataInputStream !=null){
try {
dataoutputstream = new DataOutputStream(new BufferedOutputStream(new FileOutputStream(filename)));
byte b[] = new byte[1024*10];
int len = 0;
while ((len = dataInputStream.read(b, 0, 1024)) != -1) {
dataoutputstream.write(b, 0, len);
} dataoutputstream.flush();
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
return true;
}else{
return false;
}
}
*
* 解析文件,取出URL地址
*
*/
public static void regexStr(){
String input="我想去这个网站http://www.handandaily.com问问题";
Pattern p = Pattern.compile("http://[*[a-zA-Z]|w{3}].*[a-zA-Z]");
Matcher m = p.matcher(input);
m.find();
String str=m.group();
System.out.print(str);
}
/**
* 根据URL,把网页保存到本地
* @param urlStr
* @param filename
* @return
*/
public static boolean getUrlToFileInputStream(String urlStr, String filename){
DataInputStream dataInputStream=null;
try{
URL url = new URL(urlStr);
URLConnection conn = url.openConnection();
dataInputStream = new DataInputStream(conn.getInputStream());
}catch(Exception e){
e.getMessage();
}
DataOutputStream dataoutputstream = null;
if(dataInputStream !=null){
try {
dataoutputstream = new DataOutputStream(new BufferedOutputStream(new FileOutputStream(filename)));
byte b[] = new byte[1024*10];
int len = 0;
while ((len = dataInputStream.read(b, 0, 1024)) != -1) {
dataoutputstream.write(b, 0, len);
} dataoutputstream.flush();
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
return true;
}else{
return false;
}
}
相关文章推荐
- 简单的解析文件,取URL地址,并根据地址抓下页面
- httpClient4.3 模拟Post提交,模拟Post上传文件并解决服务端使用spingMVC时upload.parseRequest(request)解析不到File,Pos简单抓取页面数据
- 关于CDH页面下载HDFS文件地址解析出错
- java中根据图片的url将文件回显在jsp页面代码
- java根据URL地址下载文件
- 读取html页面文件解析邮箱地址
- 高鹏写的winform抓取页面,根据配置文件配置读取地址
- JSP页面中外部文件路径,AJAX的请求地址(:url)到底该怎么写呢?
- java 根据URL生成mht文件,空白页面解决方案
- Angular4根据url地址读取到文件中的内容
- python根据url地址下载小文件
- html间页面静态传值(根据url地址拆分字符串获取参数)
- SEO_ASP.net SEO优化(包含URL地址重写\viewState移动和压缩至服务器\SEO信息XML生成_根据URL地址重写文件)\web网站内容压缩 源码公开.本人授权可使用于商业项目。
- 根据URL地址以流的形式获取页面内容
- php解析url地址取出文件的扩展名
- SpringCloud(第 024 篇)简单文件上传微服务,并加入 zuul 微服务后用 zuul 微服务地址采取curl或者页面点击实现文件上传
- 根据当前页面url匹配出页面内链接地址的完整路径
- C#的一个URL加载器,能处理编码、相对地址解析、GET/POST、HTML的include、页面重定向
- \t\t根据URL地址以流的形式获取页面内容
- winform抓取页面,根据配置文件配置读取地址