您的位置:首页 > 理论基础 > 计算机网络

unix网络编程之套接字地址结构

2012-11-12 16:41 246 查看
unix网络编程中首要了解的就是套接字的地址结构。没有地址,一切通信都无从谈起。而网络编程中,地址结构主要就是由协议、ip地址、端口组成的一个结构。ipv4的地址结构如下:

struct in_addr {
in_addr_t s_addr;
};

struct sockaddr_in {
uint8_t        sin_len;
sa_family_t    sin_family;
in_port_t      sin_port;
struct in_addr sin_addr;
char           sin_zero[8];
};


但是协议族有多种,因此为了支持多种协议,从而定义了一个通用的地址结构。现阶段中一般都需要强制转换成这种通用结构。比如bind函数(int bind(int, struct sockadd*, socklen_t)),它们的函数原型中就是通用结构的指针类型。通用结构为:

struct sockaddr {
uint8_t      sa_len;
sa_family_t  sa_family;
char         sa_data[14];
};
因此它们的用法常常如下:

struct sockaddr_in serv;

serv.sin_family = AF_INET;

serv.sin_port = htons(8888);

serv.sin_addr.s_addr = htonl(INADDR_ANY);

bind(sockfd, (struct sockaddr*) &serv, sizeof(serv)); // 需要将具体的地址结构强转为通用地址结构。

可以看出通用结构是16个字节的,这是适应于ipv4时代的,但是大家都知道,现在ipv4的地址不够用了。ipv6已经出来了。因此一些国际标准组织又定义了ipv6的地址结构如下:

struct in6_addr {
uint8_t sa_addr[16];
};

#define SIN6_LEN

struct sockaddr_in6 {
uin8_t           sin6_len;
sa_family_t      sin6_family;
in_port_t        sin6_port;
uint32_t         sin6_flowinfo;
struct in6_addr  sin6_addr;
uint32_t         sin6_scope_id;
};
自然又要有一个新的通用套接字地址结构来兼容所有的具体类型,其定义如下:

struct sockaddr_storage {
uint8_t      ss_len;
sa_family_t  ss_family;
};
除了ss_family和ss_len外,sockaddr_storage结构中的其他字段对用户来说是透明的。这个我猜应该是由系统保证其大小的。因此,sockaddr_storage结构必须类型强制转换成或复制成适合于ss_family字段(如AF_INET、AF_INET6)所给出地址类型的套接字地址结构中,才能访问其他字段。

有了地址结构,下一步就是把字段赋值了。但是由于上一代大佬们没有谈妥,计算机界出现了两个字节序,大端和小端。网络字节序采取的是大端表示,因此小端的主机就要将字节序做一个转换才能给地址结构赋值,而且在读取的时候也必须要转换。好在unix系统定义了下面四个函数来帮助我们转换地址和端口的字节序。

#include <netinet/in.h>

uint16_t htons(uint16_t host16bitvalue);
uint32_t htonl(uint32_t host32bitvalue);
uint16_t noths(uint16_t net16bitvalue);
uint32_t ntohl(uint32_t net32bitvalue);


字节序的问题总算搞定了,但是新的问题又出现了,我们平常使用的ip地址其实并不是二进制形式的,不是点分十进制的(ipv4)就是域名形式的,所以那四个函数对我们来说似乎并没有什么用处啊。但是有问题就要有解决方案。unix定义了三个函数来解决这个问题,但是下面主要介绍两个,因为另外一个已经不被推荐使用了。

#include <arpa/inet.h>
int inet_aton(const char *strptr, struct in_addr *addrptr);

char* inet_ntoa(struct in_addr inaddr);


第一个函数就可以将点分十进制形式的ip地址,转化为32位的网络字节序二进制形式存储在第二参数中。第二个函数自然是将二进制形式的ip地址转化为点分十进制形式,然后返回一个指向它的指针,注意该函数的参数是一个结构,而不是一个指向结构的指针。

但是通过观察这两个函数的原型就会发现,它们只适用于ipv4,对于ipv6我们该怎么办?党说了,要与时俱进,因此上面的两个函数也进步了,如下:

#include <arpa/inet.h>

int inet_pton(int family, const char* strptr, void *addrptr);

const char* inet_ntop(int family, const void *addrptr, char *strptr, size_t len);


首先说一下,由于第一个参数指明了协议的类型,因此这两个函数包括但不限于ipv4和ipv6。第一个函数尝试转化由strptr指向的字符串,并通过addrptr指针存放二进制结果。第二个函数进行相反的转换,从数值格式(addrptr)转换到表达格式(strptr)。len参数是目标存储单元的大小,以免该函数溢出。对于这个大小,通常有如下定义:

#include <netinet/in.h>

#define INET_ADDRSTRLEN  16
#define INET6_ADDRSTRLEN 46
为什么是这两个值呢?数一下ip地址表达式的数值个数就知道了。可能有人说了,ipv6好像只有40个啊,那是因为考虑到ipv6和ipv4混合地址的情况,点击查看详细博文

好了,这一节我们了解到了套接字的地址结构是什么样的,下面一篇就要更详细的来进行使用了。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: