您的位置:首页 > 其它

文件路径 正则表达式

2010-01-18 20:41 871 查看
今天为了写一个很小的项目,为了使索引文件系统具有跨平台性,需要用java正则表达式过滤来自Windows的蹩脚的路径名,我们知道,Windows
有一个很SB的文件系统就是盘符,以至于企业N个T容量的服务器尤其是磁盘阵列经常为盘符不够用头疼,这时不得不用Raid合并盘符,别以为raid只是
为了磁盘的冗余备份!——当然,扯远了。

现在进入正题,我在网上用google、baidu、bing等等等搜索引擎查了好多资料,却没有一个符合我的要求,大多数是http格式过滤,少部分是
unix
like的过滤,还有一部分是微软平台的正则,他们平台的正则不具有跨平台性!我承认,不同语言的正则在设计时是有少许符号不同的,Java这门语言的正
则是借鉴了Perl 5的正则。 无奈了,既然大家都没有跨平台的正则,那么好吧,老子自己写,一步一步调试测试,不求你们了!
经过了两个小时的设计,我的跨平台版正则新鲜出炉!可贵的是,考虑到大家都是中国人嘛,我的正则任何语言通吃,你要输入中文路径名和文件名都行,当然如果
你输入鸟语,比如日文、韩文、阿拉伯文(?不知道有没有)外星文字(只要你系统能显示的),别以为很短,有本事你们自己设计一个符合跨平台的文件路径正
则,

正则如下:

(^//.|^/|^[a-zA-Z])?:?/.+(/$)?


我来解释一下:

开头匹配 “.”(当前路径,“/”后边有匹配)

“/”(unix like绝对路径名)

a-zA-Z(盘符)匹配一个字母

中间匹配 “:”0个或1个

后边匹配 “/.”/后边的任意字符

最后匹配 “/” $代表了终结符,0个或1个,如果你输入了“/”就代表你输入了一个目录,如果不输入“/”那你File(path).isDirectory()自己判断是否是目录去吧 !

警告:
虽然后边匹配是匹配的任意字符,但由于windows和unix对文件命名都是有相应规范的,这里没列入匹配规则,我想一般也不会有人把文件名起的特别怪异吧!当然,等我把这个小项目忙完了自己再查查这两套系统的文件命名规范,修正这个正则的小漏洞

当然,我有必要把不分代码公布,以便有用的人可以先过滤用户输入的字符串,然后进行细化处理!

//code

public File filePathPreProc(String pathstr){

pathstr=pathstr.replaceAll("////", "/").trim();

System.out.println(pathstr);

java.util.regex.Pattern p=java.util.regex.Pattern.compile("(^//.|^/|^[a-zA-Z])?:?/.+(/$)?");

java.util.regex.Matcher m=p.matcher(pathstr);

//不符合要求直接返回

if(!m.matches()){

return null;

}

//这里开始文件名已经符合要求

File path=new File(pathstr);

//TODO:写自己的代码

return path;

}

这个函数是文件路径预处理函数,把用户输入的类似E://aaa//bbb ccc//cccc_ddd//alkf.xxx 或路径直接转为unix like文件路径格式,如果失败,返回空值(null)如果成功了,返回File对象。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: