您的位置:首页 > 理论基础 > 计算机网络

大端法、小端法、网络字节序 转

2015-07-11 11:50 489 查看
大端法、小端法、网络字节序 转

一.概念、定义
关于字节序(大端法、小端法)的定义
《UNXI网络编程》定义:术语“小端”和“大端”表示多字节值的哪一端(小端或大端)存储在该值的起始地址。小端存在起始地址,即是小端字节序;大端存在起始地址,即是大端字节序。

也可以说:

1.小端法(Little-Endian)就是低位字节排放在内存的低地址端即该值的起始地址,高位字节排放在内存的高地址端。

2.大端法(Big-Endian)就是高位字节排放在内存的低地址端即该值的起始地址,低位字节排放在内存的高地址端。

举个简单的例子,对于整形0x12345678。它在大端法和小端法的系统内中,分别如图1所示的方式存放。





网络字节序
我们知道网络上的数据流是字节流,对于一个多字节数值,在进行网络传输的时候,先传递哪个字节?也就是说,当接收端收到第一个字节的时候,它是将这个字节作为高位还是低位来处理呢?

网络字节序定义:收到的第一个字节被当作高位看待,这就要求发送端发送的第一个字节应当是高位。而在发送端发送数据时,发送的第一个字节是该数字在内存中起始地址对应的字节。可见多字节数值在发送前,在内存中数值应该以大端法存放。

网络字节序说是大端字节序。

比如我们经过网络发送0x12345678这个整形,在80X86平台中,它是以小端法存放的,在发送前需要使用系统提供的htonl将其转换成大端法存放,如图2所示。





字节序测试程序

不同cpu平台上字节序通常也不一样,下面写个简单的C程序,它可以测试不同平台上的字节序。

1 #include <stdio.h>
2 #include <netinet/in.h>
3 int main()
4 {
5 int i_num = 0x12345678;
6 printf("[0]:0x%x\n", *((char *)&i_num + 0));
7 printf("[1]:0x%x\n", *((char *)&i_num + 1));
8 printf("[2]:0x%x\n", *((char *)&i_num + 2));
9 printf("[3]:0x%x\n", *((char *)&i_num + 3));
10
11 i_num = htonl(i_num);
12 printf("[0]:0x%x\n", *((char *)&i_num + 0));
13 printf("[1]:0x%x\n", *((char *)&i_num + 1));
14 printf("[2]:0x%x\n", *((char *)&i_num + 2));
15 printf("[3]:0x%x\n", *((char *)&i_num + 3));
16
17 return 0;
18 }
在80X86CPU平台上,执行该程序得到如下结果:

[0]:0x78

[1]:0x56

[2]:0x34

[3]:0x12

[0]:0x12

[1]:0x34

[2]:0x56

[3]:0x78

分析结果,在80X86平台上,系统将多字节中的低位存储在变量起始地址,使用小端法。htonl将i_num转换成网络字节序,可见网络字节序是大端法。

二.判断大小端序

测试:

1 #include <iostream>
2 using namespace std;
3
4 int main(int argc, char **argv)
5 {
6     short s = 0x0102;
7     if((*(unsigned char*)&s) == 2)
8         cout<<"little endian"<<endl;
9     else if((*(unsigned char*)&s) == 1)
10         cout<<"big endian"<<endl;
11     else
12         cout<<"unknown endian\n"<<endl;
13
14     return 0;
15 }


请写一个C函数,若处理器是Big_endian的,则返回0;若是Little_endian的,则返回1

int checkCPU( )
{
{
union w
{
int a;
char b;
} c;
c.a = 1;
return(c.b ==1);
}
}

Big-Endian转换成Little-Endian如下:

#define BigtoLittle16(A) ((((uint16)(A) & 0xff00) >> 8) |

(((uint16)(A) & 0x00ff) << 8))

#define BigtoLittle32(A) ((((uint32)(A) & 0xff000000) >> 24) |

(((uint32)(A) & 0x00ff0000) >> 8) |

(((uint32)(A) & 0x0000ff00) << 8) |

(((uint32)(A) & 0x000000ff) << 24))

三.分析与什么有关系

端模式(Endian)的这个词出自Jonathan Swift书写的《格列佛游记》。这本书根据将鸡蛋敲开的方法不同将所有的人分为两类,从圆头开始将鸡蛋敲开的人被归为Big Endian,从尖头开始将鸡蛋敲开的人被归为Littile Endian。小人国的内战就源于吃鸡蛋时是究竟从大头(Big-Endian)敲开还是从小头(Little-Endian)敲开。在计算机业Big Endian和Little Endian也几乎引起一场战争。在计算机业界,Endian表示数据在存储器中的存放顺序。

PowerPC处理器主导网络市场,可以说绝大多数的通信设备都使用PowerPC处理器进行协议处理和其他控制信息的处理,这也可能也是在网络上的绝大多数协议都采用大端编址方式的原因。因此在有关网络协议的软件设计中,使用小端方式的处理器需要在软件中处理端模式的转变。而Pentium主导个人机市场,因此多数用于个人机的外设都采用小端模式,包括一些在网络设备中使用的PCI总线,Flash等设备,这也要求硬件工程师在硬件设计中注意端模式的转换。

使用大小端的处理器

常用的X86结构是小端模 式,而C51单片机则为大端模式(8位的51没有大小端之说,但Keil C51编译器是大端的)。很多的ARM,DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。SPARC处理器为大端处理器。

采用大端方式进行数据存放符合人类的正常思维,而采用小端方式进行数据存放利于计算机处理。到目前为止,采用大端或者小端进行数据存放,其孰优孰劣也没有定论。因此在一个处理器系统中,有可能存在大端和小端模式同时存在的现象。这一现象为系统的软硬件设计带来了不小的麻烦,这要求系统设计工程师,必须深入理解大端和小端模式的差别。大端与小端模式的差别体现在一个处理器的寄存器,指令集,系统总线等各个层次中。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: