文件路径 正则表达式
2010-01-18 20:41
871 查看
今天为了写一个很小的项目,为了使索引文件系统具有跨平台性,需要用java正则表达式过滤来自Windows的蹩脚的路径名,我们知道,Windows
有一个很SB的文件系统就是盘符,以至于企业N个T容量的服务器尤其是磁盘阵列经常为盘符不够用头疼,这时不得不用Raid合并盘符,别以为raid只是
为了磁盘的冗余备份!——当然,扯远了。
现在进入正题,我在网上用google、baidu、bing等等等搜索引擎查了好多资料,却没有一个符合我的要求,大多数是http格式过滤,少部分是
unix
like的过滤,还有一部分是微软平台的正则,他们平台的正则不具有跨平台性!我承认,不同语言的正则在设计时是有少许符号不同的,Java这门语言的正
则是借鉴了Perl 5的正则。 无奈了,既然大家都没有跨平台的正则,那么好吧,老子自己写,一步一步调试测试,不求你们了!
经过了两个小时的设计,我的跨平台版正则新鲜出炉!可贵的是,考虑到大家都是中国人嘛,我的正则任何语言通吃,你要输入中文路径名和文件名都行,当然如果
你输入鸟语,比如日文、韩文、阿拉伯文(?不知道有没有)外星文字(只要你系统能显示的),别以为很短,有本事你们自己设计一个符合跨平台的文件路径正
则,
正则如下:
(^//.|^/|^[a-zA-Z])?:?/.+(/$)?
我来解释一下:
开头匹配 “.”(当前路径,“/”后边有匹配)或
“/”(unix like绝对路径名)或
a-zA-Z(盘符)匹配一个字母
中间匹配 “:”0个或1个
后边匹配 “/.”/后边的任意字符
最后匹配 “/” $代表了终结符,0个或1个,如果你输入了“/”就代表你输入了一个目录,如果不输入“/”那你File(path).isDirectory()自己判断是否是目录去吧 !
警告:
虽然后边匹配是匹配的任意字符,但由于windows和unix对文件命名都是有相应规范的,这里没列入匹配规则,我想一般也不会有人把文件名起的特别怪异吧!当然,等我把这个小项目忙完了自己再查查这两套系统的文件命名规范,修正这个正则的小漏洞
当然,我有必要把不分代码公布,以便有用的人可以先过滤用户输入的字符串,然后进行细化处理!
//code
public File filePathPreProc(String pathstr){
pathstr=pathstr.replaceAll("////", "/").trim();
System.out.println(pathstr);
java.util.regex.Pattern p=java.util.regex.Pattern.compile("(^//.|^/|^[a-zA-Z])?:?/.+(/$)?");
java.util.regex.Matcher m=p.matcher(pathstr);
//不符合要求直接返回
if(!m.matches()){
return null;
}
//这里开始文件名已经符合要求
File path=new File(pathstr);
//TODO:写自己的代码
return path;
}
这个函数是文件路径预处理函数,把用户输入的类似E://aaa//bbb ccc//cccc_ddd//alkf.xxx 或路径直接转为unix like文件路径格式,如果失败,返回空值(null)如果成功了,返回File对象。
有一个很SB的文件系统就是盘符,以至于企业N个T容量的服务器尤其是磁盘阵列经常为盘符不够用头疼,这时不得不用Raid合并盘符,别以为raid只是
为了磁盘的冗余备份!——当然,扯远了。
现在进入正题,我在网上用google、baidu、bing等等等搜索引擎查了好多资料,却没有一个符合我的要求,大多数是http格式过滤,少部分是
unix
like的过滤,还有一部分是微软平台的正则,他们平台的正则不具有跨平台性!我承认,不同语言的正则在设计时是有少许符号不同的,Java这门语言的正
则是借鉴了Perl 5的正则。 无奈了,既然大家都没有跨平台的正则,那么好吧,老子自己写,一步一步调试测试,不求你们了!
经过了两个小时的设计,我的跨平台版正则新鲜出炉!可贵的是,考虑到大家都是中国人嘛,我的正则任何语言通吃,你要输入中文路径名和文件名都行,当然如果
你输入鸟语,比如日文、韩文、阿拉伯文(?不知道有没有)外星文字(只要你系统能显示的),别以为很短,有本事你们自己设计一个符合跨平台的文件路径正
则,
正则如下:
(^//.|^/|^[a-zA-Z])?:?/.+(/$)?
我来解释一下:
开头匹配 “.”(当前路径,“/”后边有匹配)或
“/”(unix like绝对路径名)或
a-zA-Z(盘符)匹配一个字母
中间匹配 “:”0个或1个
后边匹配 “/.”/后边的任意字符
最后匹配 “/” $代表了终结符,0个或1个,如果你输入了“/”就代表你输入了一个目录,如果不输入“/”那你File(path).isDirectory()自己判断是否是目录去吧 !
警告:
虽然后边匹配是匹配的任意字符,但由于windows和unix对文件命名都是有相应规范的,这里没列入匹配规则,我想一般也不会有人把文件名起的特别怪异吧!当然,等我把这个小项目忙完了自己再查查这两套系统的文件命名规范,修正这个正则的小漏洞
当然,我有必要把不分代码公布,以便有用的人可以先过滤用户输入的字符串,然后进行细化处理!
//code
public File filePathPreProc(String pathstr){
pathstr=pathstr.replaceAll("////", "/").trim();
System.out.println(pathstr);
java.util.regex.Pattern p=java.util.regex.Pattern.compile("(^//.|^/|^[a-zA-Z])?:?/.+(/$)?");
java.util.regex.Matcher m=p.matcher(pathstr);
//不符合要求直接返回
if(!m.matches()){
return null;
}
//这里开始文件名已经符合要求
File path=new File(pathstr);
//TODO:写自己的代码
return path;
}
这个函数是文件路径预处理函数,把用户输入的类似E://aaa//bbb ccc//cccc_ddd//alkf.xxx 或路径直接转为unix like文件路径格式,如果失败,返回空值(null)如果成功了,返回File对象。
相关文章推荐
- 利用正则表达式从文件路径中匹配文件名
- 本地图片文件路径正则表达式
- 文件路径的正则表达式
- 本地图片文件路径正则表达式
- lua 文件路径 字符串处理 数据结构 正则表达式 Class 程序集
- spark读取hdfs文件的路径使用正则表达式
- C#中利用正则表达式检测文件路径的合法性
- ios常用的读取文件路径操作以及正则表达式
- 正则表达式校验文件路径
- 一个关于文件路径的正则表达式
- 文件路径的正则表达式改啊改的
- 利用正则表达式从文件路径中提取出文件名(包含后缀)
- 正则表达式文件路径验证
- 正则表达式验证文件路径(windows)
- java 处理文件路径 正则表达式
- 正则表达式文件路径验证js版
- 验证文件路径的正则表达式(支持网络路径)
- Smarty 模板 图片、CSS、JavaScript文件路径替换(用ecshop的正则表达式)
- C#正则表达式匹配HTML中的图片路径
- 按正则表达式过滤符合条件的文件或文件夹的工具类