您的位置:首页 > 编程语言 > ASP

asp截取指定英汉混合字符串_支持中文

2008-10-11 00:00 537 查看
说明:本函数作用是截取指定英汉混合字符串,并保持显示长度一至。就是将一个汉字当两英文来截取。
用途:一般会用在标题显示列表,可以避免截取的字符串参插不齐的现象。
程序代码
'//A_strString要处理的字符串 
'//A_intLen以英文字符数为准 
'//A_strAddString如果A_strString有截取字符时添中的后缀,如:...,可以为空 
function CutString(byval A_strString,byval A_intLen,byval A_strAddString) 
dim MM_objRe,MM_objMs,MM_objMh 
dim MM_strCut,MM_intLen 
set MM_objRe=new RegExp 
MM_objRe.Global=true'全局搜索 
MM_objRe.IgnoreCase=true'不区分大小写 
MM_objRe.Pattern="[^\x00-\xff]" 

MM_intLen=A_intLen 
if len(A_strString)<=A_intLen then 
MM_strCut=A_strString 
else 
MM_strCut=left(A_strString,MM_intLen) 
set MM_objMs=MM_objRe.execute(MM_strCut) 
if MM_objMs.count<>MM_intLen then 
for each MM_objMh in MM_objMs 
if MM_objMh.FirstIndex<MM_intLen then 
MM_intLen=MM_intLen-1 
else 
exit for 
end if 
next 
else 
MM_intLen=MM_intLen/2 
end if 
MM_strCut=left(A_strString,MM_intLen) & A_strAddString 
end if 
CutString=MM_strCut 
set MM_objRe=nothing 
end function

这个和目前网上流行的不太一样,用的是正则式来获取非ANSI字符(这里默认非ANSI字符为汉字,如果有偏差可以修改正则式来达到目的)。先注明一点:函数指定长度以英文字符数为准。即是指定为10,含义为10个英文或5个汉字
作了两点优化:
第一点:直接获取指定长度的字符,因为不管是全汉字还是全英文,最长不过是全英文长度,超过的字符是绝对淘汰字符。
第二点:使用正则寻找范围内的汉字,并只遍历每个汉字的字数,这样可以最大程度上减少循环次数。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: