java调用HttpClient查询手机号码归属地
2017-12-09 13:23
330 查看
转载在http://guoyunsky.iteye.com/blog/662960 郭芸,感谢大神!
工作过程中抓取了很多手机号码,现需要获取他们的归属地。于是自己写了个工具类,这个工具类只是基本了实现该功能,没有考虑其他因素。
我知道手机号码归属地的判断是根据前7位,一开始本想获取他们的规律,就是哪个号码段的手机是属于哪个地区,但发现自己无法获取。于是想到了有一些网站有这个功能,同时自己也写爬虫,于是利用爬虫的思路去完成这个功能。这里大概思路是通过HttpClient去模拟提交那些网站的查询功能,这里是www.ip138.com,然后通过正则表达式去解析HttpClient相应内容,从里面抽取出手机归属地。同时对要查询的手机进行一个验证,具体代码请看如下:
Java代码
import java.util.regex.Matcher;
import java.util.regex.Pattern;
import org.apache.commons.httpclient.HttpClient;
import org.apache.commons.httpclient.NameValuePair;
import org.apache.commons.httpclient.methods.PostMethod;
import org.apache.commons.httpclient.params.HttpMethodParams;
/**
* 通过手机号码,获得该号码的归属地
*
* @author Administrator
*
*/
public class MobileFromUtil {
//正则表达式,抽取手机归属地
public static final String REGEX_GET_MOBILE=
"(?is)(<tr[^>]+>[\\s]*<td[^>]+>[\\s]*卡号归属地[\\s]*</td>[\\s]*<td[^>]+>([^<]+)</td>[\\s]*</tr>)"; //2:from
//正则表达式,审核要获取手机归属地的手机是否符合格式,可以只输入手机号码前7位
public static final String REGEX_IS_MOBILE=
"(?is)(^1[3|4|5|8][0-9]\\d{4,8}$)";
/**
* 获得手机号码归属地
*
* @param mobileNumber
* @return
* @throws Exception
*/
public static String getMobileFrom(String mobileNumber) throws Exception {
if(!veriyMobile(mobileNumber)){
throw new Exception("不是完整的11位手机号或者正确的手机号前七位");
}
HttpClient client=null;
PostMethod method=null;
NameValuePair mobileParameter=null;
NameValuePair actionParameter=null;
int httpStatusCode;
String htmlSource=null;
String result=null;
try {
client=new HttpClient();
client.getHostConfiguration().setHost("www.ip138.com", 8080, "http");
method=new PostMethod("/search.asp");
mobileParameter=new NameValuePair("mobile",mobileNumber);
actionParameter=new NameValuePair("action","mobile");
method.setRequestBody(new NameValuePair[] { actionParameter,mobileParameter });
//设置编码
method.getParams().setParameter(HttpMethodParams.HTTP_CONTENT_CHARSET, "GB2312");
client.executeMethod(method);
httpStatusCode=method.getStatusLine().getStatusCode();
if(httpStatusCode!=200){
throw new Exception("网页内容获取异常!Http Status Code:"+httpStatusCode);
}
htmlSource=method.getResponseBodyAsString();
if(htmlSource!=null&&!htmlSource.equals("")){
result=parseMobileFrom(htmlSource);
}
} catch (RuntimeException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}finally{
method.releaseConnection();
}
return result;
}
/**
* 从www.ip138.com返回的结果网页内容中获取手机号码归属地,结果为:省份 城市
*
* @param htmlSource
* @return
*/
public static String parseMobileFrom(String htmlSource){
Pattern p=null;
Matcher m=null;
String result=null;
p=Pattern.compile(REGEX_GET_MOBILE);
m=p.matcher(htmlSource);
while(m.find()){
if(m.start(2)>0){
result=m.group(2);
result=result.replaceAll(" ", " ");
}
}
return result;
}
/**
* 验证手机号
* @param mobileNumber
* @return
*/
public static boolean veriyMobile(String mobileNumber){
Pattern p=null;
Matcher m=null;
p=Pattern.compile(REGEX_IS_MOBILE);
m=p.matcher(mobileNumber);
return m.matches();
}
/**
* 测试
* @param args
* @throws Exception
*/
public static void main(String[] args) throws Exception {
System.out.println(getMobileFrom("13888888888"));
}
}
工作过程中抓取了很多手机号码,现需要获取他们的归属地。于是自己写了个工具类,这个工具类只是基本了实现该功能,没有考虑其他因素。
我知道手机号码归属地的判断是根据前7位,一开始本想获取他们的规律,就是哪个号码段的手机是属于哪个地区,但发现自己无法获取。于是想到了有一些网站有这个功能,同时自己也写爬虫,于是利用爬虫的思路去完成这个功能。这里大概思路是通过HttpClient去模拟提交那些网站的查询功能,这里是www.ip138.com,然后通过正则表达式去解析HttpClient相应内容,从里面抽取出手机归属地。同时对要查询的手机进行一个验证,具体代码请看如下:
Java代码
import java.util.regex.Matcher;
import java.util.regex.Pattern;
import org.apache.commons.httpclient.HttpClient;
import org.apache.commons.httpclient.NameValuePair;
import org.apache.commons.httpclient.methods.PostMethod;
import org.apache.commons.httpclient.params.HttpMethodParams;
/**
* 通过手机号码,获得该号码的归属地
*
* @author Administrator
*
*/
public class MobileFromUtil {
//正则表达式,抽取手机归属地
public static final String REGEX_GET_MOBILE=
"(?is)(<tr[^>]+>[\\s]*<td[^>]+>[\\s]*卡号归属地[\\s]*</td>[\\s]*<td[^>]+>([^<]+)</td>[\\s]*</tr>)"; //2:from
//正则表达式,审核要获取手机归属地的手机是否符合格式,可以只输入手机号码前7位
public static final String REGEX_IS_MOBILE=
"(?is)(^1[3|4|5|8][0-9]\\d{4,8}$)";
/**
* 获得手机号码归属地
*
* @param mobileNumber
* @return
* @throws Exception
*/
public static String getMobileFrom(String mobileNumber) throws Exception {
if(!veriyMobile(mobileNumber)){
throw new Exception("不是完整的11位手机号或者正确的手机号前七位");
}
HttpClient client=null;
PostMethod method=null;
NameValuePair mobileParameter=null;
NameValuePair actionParameter=null;
int httpStatusCode;
String htmlSource=null;
String result=null;
try {
client=new HttpClient();
client.getHostConfiguration().setHost("www.ip138.com", 8080, "http");
method=new PostMethod("/search.asp");
mobileParameter=new NameValuePair("mobile",mobileNumber);
actionParameter=new NameValuePair("action","mobile");
method.setRequestBody(new NameValuePair[] { actionParameter,mobileParameter });
//设置编码
method.getParams().setParameter(HttpMethodParams.HTTP_CONTENT_CHARSET, "GB2312");
client.executeMethod(method);
httpStatusCode=method.getStatusLine().getStatusCode();
if(httpStatusCode!=200){
throw new Exception("网页内容获取异常!Http Status Code:"+httpStatusCode);
}
htmlSource=method.getResponseBodyAsString();
if(htmlSource!=null&&!htmlSource.equals("")){
result=parseMobileFrom(htmlSource);
}
} catch (RuntimeException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}finally{
method.releaseConnection();
}
return result;
}
/**
* 从www.ip138.com返回的结果网页内容中获取手机号码归属地,结果为:省份 城市
*
* @param htmlSource
* @return
*/
public static String parseMobileFrom(String htmlSource){
Pattern p=null;
Matcher m=null;
String result=null;
p=Pattern.compile(REGEX_GET_MOBILE);
m=p.matcher(htmlSource);
while(m.find()){
if(m.start(2)>0){
result=m.group(2);
result=result.replaceAll(" ", " ");
}
}
return result;
}
/**
* 验证手机号
* @param mobileNumber
* @return
*/
public static boolean veriyMobile(String mobileNumber){
Pattern p=null;
Matcher m=null;
p=Pattern.compile(REGEX_IS_MOBILE);
m=p.matcher(mobileNumber);
return m.matches();
}
/**
* 测试
* @param args
* @throws Exception
*/
public static void main(String[] args) throws Exception {
System.out.println(getMobileFrom("13888888888"));
}
}
相关文章推荐
- Java调用免费的WebService示例【天气预报】【国内手机号码归属地查询】
- Java代码总结【1】_查询手机号码归属地
- 调用webservice查询手机号码归属地信息
- Java 用飞信发短信,获取手机号码归属地,查询城市天气预报
- 使用Jsonp调用聚合数据API免费查询手机号码归属地
- Java调用WEBSERVICE接口实现天气预报和获得国内手机号码归属地省份、地区和手机卡类型信息
- [017] Android平台HttpClient的使用-手机号码归属地查询 .
- Java 实现手机号的归属地查询 手机号码的卡的类型
- shell调用api store查询手机号码归属地
- 调用第三方API ,实现手机号码归属地及运营商查询
- 在Android中调用WebService查询手机号码归属地。
- java/android查询手机固话归属地、GSM卡信息
- 手机号码归属地批量查询软件使用说明
- 国内手机号码归属地查询WEB服务
- 手机卫士12-号码归属地查询
- PHP实现国内手机号码归属地查询
- 本地的手机号码归属地查询-oracle数据
- 手机号码归属地查询api接口
- 免费手机号码归属地API查询接口