jsp获取某网站所有链接地址
2007-09-27 13:30
429 查看
<%@ page contentType="text/html; charset=gb2312" language="java"
import="java.util.regex.*" errorPage=""%>
<%
String sCurrentLine;
String sTotalString;
sCurrentLine = "";
sTotalString = "";
java.io.InputStream l_urlStream;
java.net.URL l_url = new java.net.URL("http://www.baidu.com");
java.net.HttpURLConnection l_connection = (java.net.HttpURLConnection) l_url
.openConnection();
l_connection.connect();
l_urlStream = l_connection.getInputStream();
java.io.BufferedReader l_reader = new java.io.BufferedReader(
new java.io.InputStreamReader(l_urlStream));
while ((sCurrentLine = l_reader.readLine()) != null) {
sTotalString += sCurrentLine;
}
//String regEx = "href=([^/"']*)>";
String regEx = "href=/"([^/"]*)/"";//找出href="****"的链接
Pattern p = Pattern.compile(regEx, Pattern.CASE_INSENSITIVE);
Matcher m = p.matcher(sTotalString);
int j = 0;
while (m.find()) {
j++;
out.println("m.group(" + j + "): " + m.group(0) + "<br>");
}
regEx = "href='([^']*)'";//找出href='****'的链接
p = Pattern.compile(regEx, Pattern.CASE_INSENSITIVE);//Pattern.CASE_INSENSITIVE查找忽略大小写
m = p.matcher(sTotalString);
while (m.find()) {
j++;
out.println("m.group(" + j + "): " + m.group(0) + "<br>");
}
%>
import="java.util.regex.*" errorPage=""%>
<%
String sCurrentLine;
String sTotalString;
sCurrentLine = "";
sTotalString = "";
java.io.InputStream l_urlStream;
java.net.URL l_url = new java.net.URL("http://www.baidu.com");
java.net.HttpURLConnection l_connection = (java.net.HttpURLConnection) l_url
.openConnection();
l_connection.connect();
l_urlStream = l_connection.getInputStream();
java.io.BufferedReader l_reader = new java.io.BufferedReader(
new java.io.InputStreamReader(l_urlStream));
while ((sCurrentLine = l_reader.readLine()) != null) {
sTotalString += sCurrentLine;
}
//String regEx = "href=([^/"']*)>";
String regEx = "href=/"([^/"]*)/"";//找出href="****"的链接
Pattern p = Pattern.compile(regEx, Pattern.CASE_INSENSITIVE);
Matcher m = p.matcher(sTotalString);
int j = 0;
while (m.find()) {
j++;
out.println("m.group(" + j + "): " + m.group(0) + "<br>");
}
regEx = "href='([^']*)'";//找出href='****'的链接
p = Pattern.compile(regEx, Pattern.CASE_INSENSITIVE);//Pattern.CASE_INSENSITIVE查找忽略大小写
m = p.matcher(sTotalString);
while (m.find()) {
j++;
out.println("m.group(" + j + "): " + m.group(0) + "<br>");
}
%>
相关文章推荐
- iOS 获取html中的所有图片链接地址
- jsp利用request获取当前的链接地址
- iOS 获取html中的所有图片链接地址
- 正则表达式入门知识+用它实现在一个网页中获取所有的链接地址
- Python爬虫小实践:获取某个网站所有的外部链接以及内部链接
- 利用JSP获取网页源文件并抓取其中的链接地址
- php 接口安全检查--防止url链接或者接口地址暴露后,网站被恶意攻击
- JSP自定义标签获取用户IP地址的方法
- 获取指定(访客)IP的所有信息,地址、邮政编码、国家、经纬度等的API
- 使用Unified Communications Managed API获取Lync在线会议的链接地址
- Struts2中的链接标签 <s:url>和<s:a>---在action中获取jsp表单提交的参数(转)
- 【.net】获取网页CDM的下载链接的地址
- java,jsp获取客户端网卡物理地址
- JSP利用JNI获取硬盘信息(型号,序列号,容量...) ,提供固定下载地址
- jsp 获取地址栏的地址
- 获取统计页面所有a链接的点击次数(JS初学者)
- Android开发:用getDrawingCache方法获取ImageView中的图像需要注意的问题 本篇文章来源于 Linux公社网站(www.linuxidc.com) 原文链接:http:/
- 如何获取本机所有MAC地址
- 怎样获取页面上所有的链接数
- MUI获取窗口链接地址