您的位置：首页 > 编程语言 > C语言/C++

【零基础学习iOS开发】【02-C语言】07-基本数据类型

2013-06-06 12:18 696 查看

C语言有丰富的数据类型，因此它很适合用来编写数据库，如DB2、Oracle等大型数据库都是C语言写的。其中，提供了4种最常用的基本数据类型：char、int、float、double，使用这些数据类型，我们就可以定义相应的变量来存储数据。这讲就来深入研究一下基本数据类型的一些使用细节。

一、取值范围

我们已经知道，不同数据类型所占的存储空间是不一样的。比如在64bit编译器环境下，char类型占用1个字节，int类型占用4个字节。字节长度不一样，包含的二进制位数就不一样，能表示的数据范围也就不一样。因此，int类型能表示的数据范围肯定比char类型大。下面来简单算算64bit编译器环境下int类型的取值范围。

1.推算int类型的取值范围

int类型占用4个字节，所以一共32位，那么按理来说，取值范围应该是：0000 0000 0000 0000 0000 0000 0000 0000~1111 1111 1111 1111 1111 1111 1111 1111，也就是10进制的0 ~ 232 - 1。但是int类型是有正负之分的，包括了正数和负数，那怎么表示负数呢？就是拿最高位来当符号位，当最高位为0就是正数，最高位为1则是负数。即：1000 0000 1001 1011 1000 0000 1001 1011就是一个负数，0000 1001 0000 1101 0000 1001 0000 1101是一个正数。由于最高位是0才代表正数，因此最大的正数是0111 1111 1111 1111 1111 1111 1111 1111，也就是231 - 1。而最小的负数就是1000 0000 0000 0000 0000 0000 0000 0000，也就是-231（为什么是这个值呢？可以根据前面章节提到的负数的二进制形式，自己去换算一下，看看1000 0000 0000 0000 0000 0000 0000 0000是不是-231。算不出也不用去纠结，不影响写代码，知道有这么一回事就完了）。因此，int类型的取值范围是-231 ~ 231 - 1。

注意：这个推算过程是不用掌握的，大致知道过程就行了，而且这个结论也不用去记，大致知道范围就行了。

2.各种数据类型的取值范围

int类型的取值范围已经会算了，那么其他数据类型的取值范围就能够以此类推。

（注：float和double由于是小数，它们的存储方式是特别不一样的，所以它们取值范围的算法也很不一样，这里不做介绍，也不用去掌握。e38表示乘以10的38次方，e-38表示乘以10的负38次方。）

上面表格中列出的只是64bit编译器环境下的情况。如果你的编译器是16bit或者32bit，这些数据类型的取值范围肯定是不一样的。比如int类型，在16bit编译器环境下是占用2个字节的，共16bit，所以int类型的取值范围是：-215 ~ 215 - 1。

3.数值越界

1> 例子演示

前面已经看到，每种数据类型都有自己的取值范围。如果给一个变量赋值了一个超出取值范围的数值，那后果会不堪设想。

#include <stdio.h>

int main()
{
int c = 1024 * 1024 * 1024 * 4;

printf("%d\n", c);
return 0;
}

我们都知道，int类型能保存的最大值是231-1。在第5行给int类型的变量c赋值一个比231-1大的数值：232 （1024是210）

先看看在终端中的输出结果：

，可以看出输出的值是0。

2> 结果分析

我们可以简单分析一下为什么将232赋值给变量c之后输出的是0。232的二进制形式是：1 0000 0000 0000 0000 0000 0000 0000 0000，一共有33位二进制数。变量c占用了4个字节，只能容纳32位二进制数，而且内存寻址是从大到小的，因此，变量c在内存中的存储形式是0000 0000 0000 0000 0000 0000 0000 0000，也就是0，最前面的那个1就不属于变量c的了。

3> 结论

可以发现，如果超出了变量的取值范围，那么将损失精度，得到“垃圾数据”（“垃圾数据”就是指并非我们想要的数据）。可是，有时候我们确实要存储一个很大很大的整数，比231-1还大的整数，这该怎么办呢？这个就要用到类型说明符，这这讲的后面会讨论。

二、char

1.简单使用

char是C语言中比较灵活的一种数据类型，称为“字符型”。既然叫“字符型”，那肯定是用来存储字符的，因此我们可以将一个字符常量赋值给一个字符型变量。

#include <stdio.h>

int main()
{
char c = 'A';

printf("%c\n", c);
return 0;
}

在第5行定义了一个char类型变量c，并将字符常量'A'赋值给了c。在第7行将字符变量c输出到屏幕，%c的意思是以字符的格式输出。

输出结果：

2.字符常量一定要用单引号括住

1> 下面的写法是错误的：

int main()
{
char c = A;
return 0;
}

编译器会直接报第3行的错，错误原因是：标识符A找不到。你直接写个大写A，编译器会认为这个A是一个变量。因此写成'A'才是正确的，或者在第3行代码的前面再定义1个变量名叫做A的char类型变量。

2> 下面的写法也是错误的：

int main()
{
char c = "A";
return 0;
}

第3行中的"A"并不是字符常量，而是字符串常量，将字符串"A"赋值给字符变量c是错误的做法。字符串和字符的存储机制不一样，因此"A"和'A'是有本质区别的。

3.字符型变量还可以当做整型变量使用

1个字符型变量占用1个字节，共8位，因此取值范围是-27~27-1。在这个范围内，你完全可以将字符型变量当做整型变量来使用。

#include <stdio.h>

int main()
{
char c1 = -10;

char c2 = 120;

printf("c1=%d  c2=%d \n", c1, c2);
return 0;
}

由于第9行用的是%d，表示以十进制整数格式输出，输出结果：

。因此，如果使用的整数不是很大的话，可以使用char代替int，这样的话，更节省内存开销。

4.字符型变量只能存储单字节字符

其实字符有2种类型：单字节字符和双字节字符。

单字节字符：在内存中占用1个字节的字符。包括了26个英文字母的大小写、10个阿拉伯数字等字符；

双字节字符：在内存中占用2个字节的字符。包括了中国、日本和韩国等国家的文字，比如汉字。

1个字符型变量只占用1个字节，所以1个字符型变量只能存储1个单字节字符。

下面的写法是错误的：

#include <stdio.h>

int main()
{
char c = 'ABCD';

printf("%c\n", c);
return 0;
}

编译器会对上面的代码发出警告，并不会报错，因此程序还是能够运行。由于变量c只能存储1个单字节字符，最终变量c只存储了'ABCD'中的'D'。

输出结果：

5.字符型变量不能存储汉字

在内存中，1个汉字需要用2个字节来存储，而1个字符型变量只占用1个字节的存储空间，所以字符型变量不能用来存储汉字。

下面的写法是错误的：

int main()
{
char c = '男';
return 0;
}

编译器会直接报第3行的错误。记住一个原则：单引号括住的必须是单字节字符。

6.ASCII

说到字符，就不得不提ASCII这个概念

1> ASCII是基于拉丁字母的一套电脑编码系统，是现今最通用的单字节编码系统，全称是“American Standard Code for Information Interchange”。编码系统，看起来好像很高级，其实就是一个字符集---字符的集合。

2> ASCII字符集包括了：所有的大写和小写英文字母，数字0到9，标点符号，以及一些特殊控制字符：如退格、删除、制表、回车，一共128个字符，全部都是“单字节字符”。

3> 在计算机中的任何数据都是以二进制形式存储的，因此每个ASCII字符在内存中是以二进制形式存储的，而且只占用1个字节，二进制数的值就称为这个ASCII字符的ASCII值。比如大写字母A在内存中的二进制形式是：0100 0001，那么它的ASCII值就是65。

4> 下面是一张ASCII码字符表，ASCII码值的范围是0~127

5> 我们都知道1个char型变量只占用1个字节的存储空间，而所有的ASCII字符都是单字节字符，因此char型变量能存储任何ASCII字符。而且在使用char型变量存储ASCII字符时，可以直接用ASCII字符，也可以用ASCII值。

#include <stdio.h>

int main()
{
char c1 = 65;

char c2 = 'A';

printf("c1=%c  c2=%c \n", c1, c2);
return 0;
}

在第5、7行分别定义了字符型变量c1、c2。很明显，变量c2存储的是ACII字符'A'；变量c1存储的是65，而ASCII值65对应的ASCII字符就是'A'，因此变量c1存储的也是'A'。

由于第9行用的是%c，表示以字符格式输出，输出结果：

5> 经过上面的例子后，应该知道6和'6'的区别了吧

#include <stdio.h>

int main()
{
char c1 = 6;

char c2 = '6';

printf("c1=%d  c2=%d \n", c1, c2);
return 0;
}

第5行给变量c1赋值了整数6，第7行给变量c2赋值了字符'6'，'6'的ASCII值是54。

由于第9行用的是%d，表示以十进制整数格式输出，输出结果：

三、说明符

1.什么是说明符

1> 我们已经知道，在64bit编译器环境下，1个int类型变量取值范围是-231 ~ 231 - 1，最大值是231-1。有时候，我们要使用的整数可能比231-1还大，比如234这个整数，如果还坚持用int类型变量来存储这个值的话，就会损失精度，得到的是垃圾数据。为了解决这个问题，C语言允许我们给int类型的变量加一些说明符，某些说明符可以增大int类型变量的长度，这样的话，int类型变量能存储的数据范围就变大了。

2> C语言提供了以下4种说明符，4个都属于关键字：

short 短型

long 长型

signed 有符号型

unsigned 无符号型

按照用途进行分类，short和long是一类，signed和unsigned是一类。

2.用法演示

这些说明符一般就是用来修饰int类型的，所以在使用时可以省略int

// 下面两种写法是等价的
short int s1 = 1;
short s2 = 1;

// 下面两种写法是等价的
long int l1 = 2;
long l2 = 2;

// 可以连续使用2个long
long long ll = 10;

// 下面两种写法是等价的
signed int si1 = 3;
signed si2 = 3;

// 下面两种写法是等价的
unsigned int us1 = 4;
unsigned us2 = 4;

// 也可以同时使用2种修饰符
signed short int ss = 5;
unsigned long int ul = 5;

1> 第2行中的short int和第3行中的short是等价的。

2> 看第10行，可以连续使用两个long。long的作用会在后面解释。

3> 注意第21和22行，可以同时使用两种不同的说明符。但是不能同时使用相同类型的修饰符，也就是说不能同时使用short和long 或者不能同时使用signed和unsigned。

3.short和long

1> short和long可以提供不同长度的整型数，也就是可以改变整型数的取值范围。在64bit编译器环境下，int占用4个字节（32bit），取值范围是-231~231-1；short占用2个字节（16bit），取值范围是-215~215-1；long占用8个字节（64bit），取值范围是-263~263-1

2> 总结一下：在64位编译器环境下，short占2个字节(16位)，int占4个字节(32位)，long占8个字节(64位)。因此，如果使用的整数不是很大的话，可以使用short代替int，这样的话，更节省内存开销。

3> 世界上的编译器林林总总，不同编译器环境下，int、short、long的取值范围和占用的长度又是不一样的。比如在16bit编译器环境下，long只占用4个字节。不过幸运的是，ANSI \ ISO制定了以下规则：

short跟int至少为16位(2字节)

long至少为32位(4字节)

short的长度不能大于int，int的长度不能大于long

char一定为为8位(1字节)，毕竟char是我们编程能用的最小数据类型

4> 可以连续使用2个long，也就是long long。一般来说，long long的范围是不小于long的，比如在32bit编译器环境下，long long占用8个字节，long占用4个字节。不过在64bit编译器环境下，long long跟long是一样的，都占用8个字节。

5> 还有一点要明确的是：short int等价于short，long int等价于long，long long int等价于long long

4.long的使用注意

1> 常量

long和int都能够存储整型常量，为了区分long和int，一般会在整型常量后面加个小写字母l，比如100l，表示long类型的常量。如果是long long类型呢，就加2个l，比如100ll。如果什么都不加，就是int类型的常量。因此，100是int类型的常量，100l是long类型的常量，100ll是long long类型的常量。

int main()
{
int a = 100;

long b = 100l;

long long c = 100ll;

return 0;
}

变量a、b、c最终存储的值其实都是100，只不过占用的字节不相同，变量a用4个字节来存储100，变量b、c则用8个字节来存储100。

其实，你直接将100赋值给long类型的变量也是没问题的，照样使用。因为100是个int类型的常量，只要有4个字节，就能存储它，而long类型的变量b有8个字节，那肯定可以装下100啦。

int main()
{
long b = 100;

return 0;
}

2> 输出

#include <stdio.h>

int main()
{
long a = 100000000000l;

printf("%d\n", a);
return 0;
}

在第5行定义了long类型变量a，在第7行尝试输出a的值。注意了，这里用的是%d，表示以十进制整数格式输出，%d会把a当做int类型来输出，它认为a是4个字节的。由于a是long类型的，占用8个字节，但是输出a的时候，只会取其中4个字节的内容进行输出，所以输出结果是：

又是传说的垃圾数据

那怎样才能完整地输出long类型呢？应该用格式符%ld

#include <stdio.h>

int main()
{
long a = 100000000000l;

printf("%ld\n", a);
return 0;
}

注意第7行，双引号里面的是%ld，表示输出1个long类型的整数，这时候的输出结果是：

如果是long long类型，应该用%lld

#include <stdio.h>

int main()
{
long long a = 100000000000ll;

printf("%lld\n", a);
return 0;
}

5.signed和unsigned

1> 首先要明确的：signed int等价于signed，unsigned int等价于unsigned

2> signed和unsigned的区别就是它们的最高位是否要当做符号位，并不会像short和long那样改变数据的长度，即所占的字节数。

signed：表示有符号，也就是说最高位要当做符号位，所以包括正数、负数和0。其实int的最高位本来就是符号位，已经包括了正负数和0了，因此signed和int是一样的，signed等价于signed int，也等价于int。signed的取值范围是-231 ~ 231 - 1

unsigned：表示无符号，也就是说最高位并不当做符号位，所以不包括负数。在64bit编译器环境下面，int占用4个字节（32bit），因此unsigned的取值范围是：0000 0000 0000 0000 0000 0000 0000 0000 ~ 1111 1111 1111 1111 1111 1111 1111 1111，也就是0 ~ 232 - 1

6.signed、unsigned也可以修饰char，long还可以修饰double

知道有这么一回事就行了。

unsigned char c1 = 10;
signed char c2 = -10;

long double d1 = 12.0;

7.不同数据类型所占用的存储空间

四、自动类型提升

1.什么是自动类型提升

先来看看下面的一则运算

#include <stdio.h>

int main()
{
int a = 10;

double d = a + 9.5;

printf("%f \n", d);

return 0;
}

1> 在第5行定义了一个int类型的变量a，赋值了一个整数10。

2> 接着在第7行取出a的值10，加上浮点数9.5，这里做了一个“加法运算”，并且将“和”赋值给d。所以d的值应该是19.5。

3> 在第9行使用格式符%f输出浮点型变量d，默认是保留6位小数的。输出结果为：

4> 看似这么简单的运算，其实包含了一些语法细节在里面。严格来说，相同数据类型的值才能进行运算（比如加法运算），而且运算结果依然是同一种数据类型。第7行的情况是：变量a的值10是int类型（4字节），9.5是double类型（8字节）。很明显，10和9.5并不是相同数据类型。按理来说，10和9.5是不允许进行加法运算的。但是，系统会自动对占用内存较少的类型做一个“自动类型提升”的操作，也就把10提升为double类型。也就是说，本来是用4个字节来存放10的，现在改为用8个字节来存放10。因此，10和9.5现在都是用8个字节来存放的，都是double类型，然后就可以进行运算了。并且把运算结果赋值给double类型的变量d。

5> 需要注意的是：经过第7行代码后，变量a一直都还是int类型的，并没有变成double类型。1个变量在它定义的时候是什么类型，那么就一直都是什么类型。“自动类型提升”只是在运算过程中进行的。

2.常见的自动类型提升

int main()
{
float a = 10 + 3.45f;// int 提升为 float

int b = 'A' + 32; // char 提升为 int

double c = 10.3f + 5.7; // float 提升为 double

return 0;
}

1> 注意第5行，系统会将字符'A'提升为int类型数据，也就是转为'A'的ASCII值后再跟32进行加法运算。'A'的ASCII值是65，因此变量b的值为65+32=97。

2> 这个自动类型提升，知道有这么一回事就行了，不用死记这规则，因为系统会自动执行这个操作。

五、强制类型转换

1.什么是强制类型转换

先来看看下面的代码

#include <stdio.h>

int main()
{
int i = 10.7;

printf("%d \n", i);
return 0;
}

1> 注意第5行，我们将一个8个字节的浮点数10.7赋值给了只有4个字节存储空间的整型变量i。可以想象得到，把8个字节的内容塞给4个字节，肯定会损失精度。在第7行将变量i的值输出，输出结果是：

输出值为10，这是必然的。

2> 这里面也有一点语法细节，其实第5行做了一个“强制类型转换”的操作：由于左边是int类型的变量i，那么就会强制把double类型的10.7转换为int类型的10，并且把转换后的值赋值给了整型变量i。由于C语言是语法限制不严格，所以系统会自动强制转换，如果换做是其他语法严格的语言，比如Java，第5行代码早就报错了。

3> 如果写得严格一点，明显地进行“强制类型转换”，应该这样写：

#include <stdio.h>

int main()
{
int i = (int) 10.7;

printf("%d \n", i);
return 0;
}

注意第5行，在10.7的前面加了个(int)，表示强制转换为int类型的数据。这样就绝对不会有语法问题了。总之你将一个浮点型数据转换为整型数据，就会丢失小数部分的值。

2.常见的强制类型转换

int main()
{
int a = 198l; // long 转换为 int

char b = 65; // int 转换为 char

int c = 19.5f; // float 转换为 int

return 0;
}

这个强制类型转换，知道有这么一回事就行了，不用死记这规则，因为很多时候系统会自动执行这个操作。

3.其他用法

前面看到的强制转换好像都是“大类型”转为“小类型”，其实这是不一样的，也可以由“小类型”转为“大类型”

int main()
{
int a = 10;

double b = (double)a  + 9.6;

return 0;
}

注意第5行，先将a的值强制转换为double类型后，再跟9.6进行加法运算。这样的话，系统就不用执行“自动类型提升”的操作了。其实你不强转也可以的，因为系统会做一个“自动类型提升”的操作，将变量a的值10提升为double类型。知道有这用法就行了，以后某些地方会用得上。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航