您的位置:首页 > 其它

正则只替换URL字符串里面的汉字部分

2008-09-17 07:41 267 查看
原文地址: http://www.java2000.net/p9806
URL为 http://192.168.1.1:8080/resources/电话.xls 如果使用 URLEncoder.encode 将会把冒号等一块给替换了
http%3A%2F%2F192.168.1.1%3A8080%2Fresources%2F%E7%94%B5%E8%AF%9D.xls

这并不是我们需要的,我们只希望替换编码里面中文的部分,这里给出了解决方法,很简单

package log;

import java.io.UnsupportedEncodingException;
import java.net.URLEncoder;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

/**
* 正则替换字符串里面的汉字部分。
*
* @author 赵学庆 www.java2000.net
*/
public class URLEncoderHZ {
public static void main(String[] args) throws Exception {
String str = "http://192.168.1.1:8080/resources/电话.xls";
System.out.println(encode(str, "UTF-8"));
}

private static String zhPattern = "[/u4e00-/u9fa5]+";

/**
* 替换字符串卷
*
* @param str 被替换的字符串
* @param charset 字符集
* @return 替换好的
* @throws UnsupportedEncodingException 不支持的字符集
*/
public static String encode(String str, String charset) throws UnsupportedEncodingException {
Pattern p = Pattern.compile(zhPattern);
Matcher m = p.matcher(str);
StringBuffer b = new StringBuffer();
while (m.find()) {
m.appendReplacement(b, URLEncoder.encode(m.group(0), charset));
}
m.appendTail(b);
return b.toString();
}
}

运行结果
http://192.168.1.1:8080/resources/%E7%94%B5%E8%AF%9D.xls
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: