您的位置:首页 > 其它

VC平台下各种字符串定义总结

2016-08-06 16:45 246 查看
        在Window平台下开发时,总是遇到类似LPSTR、LPCSTR、LPWSTR、LPCWSTR这类的字符串别名,如果搞不清楚,会十分蛋疼……

最近我也是在着手处理把项目从Unicode转多字节字符集/多字节字符集转Unicode,期间各种编码,字符类型啥的几百上千个错误,各种定义,各种别名满天飞,哎,是在受不了了,所以总结下……

首先提醒各位的是:建立项目初期(本片博客只针对Window平台下的项目),一定要选定好编码的字符集,不然后期,移接、转换语言会有各种问题……

众所周知,打开visual studio,创建项目,右键项目属性->配置属性->常规,查看面板中 项目默认值选项的 字符集选项,会发现有两种选择:Unicode 和 多字节字符集(这俩种有啥区别呢?见我慢慢道来……)

一、简易介绍:
1.Unicode:
Unicode(即“统一码、万国码”),说的这么高大上,个人理解为:Unicode就是宽字节编码, 每两个字节表示一个任意字符。因为传统的单字节编码可以满足英文字符,数字啥的,但时一旦跨越语言,就不行了(一个无符号字节8位,所能表示的二进制数也就
是0~255的范围,处理英文 + 数字 + 键盘上的若干符号还是可以的)。因此就需要更多位数来表示更多的字符,所以就需要Unicode编码。 例如:"abc"占6个字节,"呵呵abc"占10个字节(这中间有5个字符,每个字符占2个字节,结果就是 5×2 = 10)

2.多字节字符集:
也就是传统字符集,就是一个或多个字节表示一个任意字符。例如"abc"占3个字节,"呵呵abc"占9个字节(其中每个汉字占3个字节)
有人肯定会疑惑:什么JB玩意儿,为啥Unicode下汉字占2字节,传统字符集下汉字就占3字节 ? 原因就是Unicode是宽字节,以2字节为单位,2个字节就代表任意一个字符,管你是什么字符都满足(国际规定是这样,两个字节可以涵盖几乎所有字符了);而传统
字符集是以1字节为单位,表示不了所有字符,就比方说 汉字,就尼玛255的范围,你能干啥?所以要用一个或多个字节表示任意字符了。
bb这么多,不知你是否明白,好吧,以上只是我个人理解,文辞比较粗俗,如果还是不懂,可自行度娘查找更权威详细的解释和案例……

二、回归主题,言归正传了:
C / C++语法规定,char表示字符类型,char*,char[]表示"字符串",也就是多个字符的意思(请不要纠结细节,原理基本是这样,这里简陋的说明一下,有利于展开思路)
因此到了Windows平台下就有:
关键字				typdef
char			  CHAR
char*			  PCHAR、LPSTR等
wchar_t			  WCHAR
wchar_t* 		  PWCHAR、LPWSTR等

如果想自动检测字符集的话(Unicode和多字符集), Windows又为我们提供了大量条件编译(宏 + 别名):
会根据:
#ifdef UNICODE
采用宽字符
#else
采用窄字符
#end

TCHAR			根据上述原理判断是 CHAR 还是 WCHAR
LPTSTR			同上,判断是 LPCHAR 还是 LPWCHAR
LPTCSTRconst 	char* / const wchar_t*等

……根据微软命名规律,依次类推 :
LP 表示指针,T表示条件编译自动选择char还是wchar_t,C表示const,STR表示"字符串"的意思……
大概掌握这个命名套路,然后你再看LPWSTR、LPCWSTR、LPCTSTR是不是瞬间一目了然了?
然后我们常用的字符串操作函数也对应"宽"、"窄"版本,这里我大概介绍一些命名规律,你们今后也可以一目了然
窄字节版本(原始版本)		   宽字节版本			  条件编译, 自动选择的版本
strcpy 					 wcscpy 			    _tcscpy
strcat 					 wcscat				    _tcscat
strcmp 					 wcscmp 			    _tcscmp
sprintf(wsprintfA)		 sprintfW 			    wsprintf
"字符串"				   L"字符串"			    _T("字符串")

……以上其实还有更多的typdef版本,我只列举常用,很明显规律的,大家方便理解记忆就好
其实我要bb的暂时就这些,以后有机会再补充补充吧!

总结就是:创建项目时,要预先考虑到是否多平台、多语言、以及是否有多项目依赖,然后要选用通用的字符集,或者一致的字符集,最好是带有条件编译的多版本函数,免得到时候
几个项目以综合,发现尼玛编码格式不一样,然后就跪了……


常用函数对照

ANSIUNICODE通用说明
数据类型
(char.h)(wchar.h)(tchar.h) 
charwchar_tTCHAR 
char *wchar_t *TCHAR* 
LPSTRLPWSTRLPTSTR 
LPCSTRLPCWSTRLPCTSTR 
    
字符串转换
atoi_wtoi_ttoi把字符串转换成整数(int)
atol_wtol_ttol把字符串转换成长整型数(long)
atof_wtof_tstof把字符串转换成浮点数(double)
itoa_itow_itot将任意类型的数字转换为字符串
    
字符串操作
strlenwcslen_tcslen获得字符串的数目
strcpywcscpy_tcscpy拷贝字符串
strncpywcsncpy_tcsncpy类似于strcpy/wcscpy,同时指定拷贝的数目
strcmpwcscmp_tcscmp比较两个字符串
strncmpwcsncmp_tcsncmp类似于strcmp/wcscmp,同时指定比较字符字符串的数目
strcatwcscat_tcscat把一个字符串接到另一个字符串的尾部
strncatwcsncat_tcsnccat类似于strcat/wcscat,而且指定粘接字符串的粘接长度.
strchrwcschr_tcschr查找子字符串的第一个位置
strrchrwcsrchr_tcsrchr从尾部开始查找子字符串出现的第一个位置
strpbrkwcspbrk_tcspbrk从一字符字符串中查找另一字符串中任何一个字符第一次出现的位置
strstrwcsstr/wcswcs_tcsstr在一字符串中查找另一字符串第一次出现的位置
strcspnwcscspn_tcscspn返回不包含第二个字符串的的初始数目
strspnwcsspn_tcsspn返回包含第二个字符串的初始数目
strtokwcstok_tcstok根据标示符把字符串分解成一系列字符串
 wcswidth 获得宽字符串的宽度
 wcwidth 获得宽字符的宽度
    
字符串测试
isasciiiswascii_istascii测试字符是否为ASCII 码字符, 也就是判断c 的范围是否在0 到127 之间
isalnumiswalnum_istalnum测试字符是否为数字或字母
isalphaiswalpha_istalpha测试字符是否是字母
iscntrliswcntrl_istcntrl测试字符是否是控制符
isdigitiswdigit_istdigit测试字符是否为数字
isgraphiswgraph_istgraph测试字符是否是可见字符
isloweriswlower_istlower测试字符是否是小写字符
isprintiswprint_istprint测试字符是否是可打印字符
ispunctiswpunct_istpunct测试字符是否是标点符号
isspaceiswspace_istspace测试字符是否是空白符号
isupperiswupper_istupper测试字符是否是大写字符
isxdigitiswxdigit_istxdigit测试字符是否是十六进制的数字
大小写转换
tolowertowlower_totlower把字符转换为小写
touppertowupper_totupper把字符转换为大写
字符比较
strcollwcscoll_tcscoll比较字符串
日期和时间转换
strftimewcsftime_tcsftime根据指定的字符串格式和locale设置格式化日期和时间
strptime  根据指定格式把字符串转换为时间值, 是strftime的反过程
打印和扫描字符串
printfwprintf_tprintf使用vararg参量的格式化输出到标准输出
fprintffwprintf_ftprintf使用vararg参量的格式化输出
scanfwscanf_tscanf从标准输入的格式化读入
fscanffwscanf_ftscanf格式化读入
sprintfswprintf_stprintf根据vararg参量表格式化成字符串
sscanfswscanf_stscanf以字符串作格式化读入
vfprintfvfwprintf_vftprintf使用stdarg参量表格式化输出到文件
vprintf  使用stdarg参量表格式化输出到标准输出
vsprintfvswprintf_vstprintf格式化stdarg参量表并写到字符串
sprintf_sswprintf_s_stprintf_s格式化字符串
数字转换
strtodwcstod_tcstod把字符串的初始部分转换为双精度浮点数
strtolwcstol_tcstol把字符串的初始部分转换为长整数
strtoulwcstoul_tcstoul把字符串的初始部分转换为无符号长整数
_strtoi64_wcstoi64_tcstoi64 
    
输入和输出
fgetcfgetwc_fgettc从流中读入一个字符并转换为宽字符
fgetsfgetws_fgetts从流中读入一个字符串并转换为宽字符串
fputcfputwc_fputtc把宽字符转换为多字节字符并且输出到标准输出
fputsfputws_fputts把宽字符串转换为多字节字符并且输出到标准输出串
getcgetwc_gettc从标准输入中读取字符, 并且转换为宽字符
getchargetwchar_gettchar从标准输入中读取字符
putcputwc_puttc标准输出
putcharputwchar_puttchar标准输出
ungetcungetwc_ungettc把一个字符放回到输入流中
 
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: