您的位置：首页 > 理论基础 > 计算机网络

unix网络编程之套接字地址结构

2012-11-12 16:41 246 查看

unix网络编程中首要了解的就是套接字的地址结构。没有地址，一切通信都无从谈起。而网络编程中，地址结构主要就是由协议、ip地址、端口组成的一个结构。ipv4的地址结构如下：

struct in_addr {
in_addr_t s_addr;
};

struct sockaddr_in {
uint8_t        sin_len;
sa_family_t    sin_family;
in_port_t      sin_port;
struct in_addr sin_addr;
char           sin_zero[8];
};

但是协议族有多种，因此为了支持多种协议，从而定义了一个通用的地址结构。现阶段中一般都需要强制转换成这种通用结构。比如bind函数（int bind(int, struct sockadd*, socklen_t))，它们的函数原型中就是通用结构的指针类型。通用结构为：

struct sockaddr {
uint8_t      sa_len;
sa_family_t  sa_family;
char         sa_data[14];
};

因此它们的用法常常如下：

struct sockaddr_in serv;

serv.sin_family = AF_INET;

serv.sin_port = htons(8888);

serv.sin_addr.s_addr = htonl(INADDR_ANY);

bind(sockfd, (struct sockaddr*) &serv, sizeof(serv)); // 需要将具体的地址结构强转为通用地址结构。

可以看出通用结构是16个字节的，这是适应于ipv4时代的，但是大家都知道，现在ipv4的地址不够用了。ipv6已经出来了。因此一些国际标准组织又定义了ipv6的地址结构如下：

struct in6_addr {
uint8_t sa_addr[16];
};

#define SIN6_LEN

struct sockaddr_in6 {
uin8_t           sin6_len;
sa_family_t      sin6_family;
in_port_t        sin6_port;
uint32_t         sin6_flowinfo;
struct in6_addr  sin6_addr;
uint32_t         sin6_scope_id;
};

自然又要有一个新的通用套接字地址结构来兼容所有的具体类型，其定义如下：

struct sockaddr_storage {
uint8_t      ss_len;
sa_family_t  ss_family;
};

除了ss_family和ss_len外，sockaddr_storage结构中的其他字段对用户来说是透明的。这个我猜应该是由系统保证其大小的。因此，sockaddr_storage结构必须类型强制转换成或复制成适合于ss_family字段（如AF_INET、AF_INET6)所给出地址类型的套接字地址结构中，才能访问其他字段。

有了地址结构，下一步就是把字段赋值了。但是由于上一代大佬们没有谈妥，计算机界出现了两个字节序，大端和小端。网络字节序采取的是大端表示，因此小端的主机就要将字节序做一个转换才能给地址结构赋值，而且在读取的时候也必须要转换。好在unix系统定义了下面四个函数来帮助我们转换地址和端口的字节序。

#include <netinet/in.h>

uint16_t htons(uint16_t host16bitvalue);
uint32_t htonl(uint32_t host32bitvalue);
uint16_t noths(uint16_t net16bitvalue);
uint32_t ntohl(uint32_t net32bitvalue);

字节序的问题总算搞定了，但是新的问题又出现了，我们平常使用的ip地址其实并不是二进制形式的，不是点分十进制的（ipv4）就是域名形式的，所以那四个函数对我们来说似乎并没有什么用处啊。但是有问题就要有解决方案。unix定义了三个函数来解决这个问题，但是下面主要介绍两个，因为另外一个已经不被推荐使用了。

#include <arpa/inet.h>
int inet_aton(const char *strptr, struct in_addr *addrptr);

char* inet_ntoa(struct in_addr inaddr);

第一个函数就可以将点分十进制形式的ip地址，转化为32位的网络字节序二进制形式存储在第二参数中。第二个函数自然是将二进制形式的ip地址转化为点分十进制形式，然后返回一个指向它的指针，注意该函数的参数是一个结构，而不是一个指向结构的指针。

但是通过观察这两个函数的原型就会发现，它们只适用于ipv4，对于ipv6我们该怎么办？党说了，要与时俱进，因此上面的两个函数也进步了，如下：

#include <arpa/inet.h>

int inet_pton(int family, const char* strptr, void *addrptr);

const char* inet_ntop(int family, const void *addrptr, char *strptr, size_t len);

首先说一下，由于第一个参数指明了协议的类型，因此这两个函数包括但不限于ipv4和ipv6。第一个函数尝试转化由strptr指向的字符串，并通过addrptr指针存放二进制结果。第二个函数进行相反的转换，从数值格式（addrptr）转换到表达格式（strptr）。len参数是目标存储单元的大小，以免该函数溢出。对于这个大小，通常有如下定义：

#include <netinet/in.h>

#define INET_ADDRSTRLEN  16
#define INET6_ADDRSTRLEN 46

为什么是这两个值呢？数一下ip地址表达式的数值个数就知道了。可能有人说了，ipv6好像只有40个啊，那是因为考虑到ipv6和ipv4混合地址的情况，点击查看详细博文

好了，这一节我们了解到了套接字的地址结构是什么样的，下面一篇就要更详细的来进行使用了。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航