您的位置：首页 > 运维架构 > Linux

Linux下Socket编程

2015-07-20 15:13 435 查看

一、socket介绍
　　socket接口是TCP/IP网络的API，socket接口定义了许多函数或例程，程序员可以用它们来开发TCP/IP网络上的应用程序。要学Internet上的TCP/IP网络编程，必须理解socket接口。

　　socket接口设计者最先是将接口放在Unix操作系统里面的。如果了解Unix系统的输入和输出的话，就很容易了解socket了。网络的socket数据传输是一种特殊的I/O，socket也是一种文件描述符。socket也具有一个类似于打开文件的函数调用socket()，该函数返回一个整型的socket描述符，随后的连接建立、数据传输等操作都是通过该socket实现的。常用的socket类型有两种：流式socket
（SOCK_STREAM）和数据报式socket（SOCK_DGRAM）。流式是一种面向连接的socket，针对于面向连接的TCP服务应用；数据报式socket是一种无连接的socket，对应于无连接的UDP服务应用。

　　二、Socket创建

　　socket函数原型为：

　　include

　　include

　　int socket(int domain, int type, int protocol);

　　功能：调用成功，返回socket文件描述符；失败，返回－1，并设置errno

　　参数说明：

　　domain指明所使用的协议族，通常为PF_INET，表示互联网协议族（TCP/IP协议
族；

　　type参数指定socket的类型：

　　SOCK_STREAM 提供有序、可靠、双向及基于连接的字节流

　　SOCK_DGRAM 支持数据报

　　SOCK_SEQPACKET 提供有序、可靠、双向及基于连接的数据报通信

　　SOCK_RAW 提供对原始网络协议的访问

　　SOCK_RDM 提供可靠的数据报层，但是不保证有序性

　　protocol通常赋值"0".

　　socket描述符是一个指向内部数据结构的指针，它指向描述符表入口。调用socket函数时，socket执行体将建立一个socket，实际上"建立一个socket"意味着为一个socket数据结构分配存储空间。socket执行体为你管理描述符表。

　　两个网络程序之间的一个网络连接包括五种信息：通信协议、本地协议地址、本地主机端口、远端主机地址和远端协议端口。socket数据结构中包含这五种信息。

　　三、Socket邦定

　　Bind函数原型为：

　　include

　　include

　　int bind(int sock_fd,struct sockaddr *my_addr, int addrlen);

　　功能说明：将套接字和指定的端口相连。成功返回0，否则，返回－1，并置errno.

　　参数说明：sock_fd是调用socket函数返回的socket描述符,

　　my_addr是一个指向包含有本机IP地址及端口号等信息的sockaddr类型的指针；

　　addrlen常被设置为sizeof(struct sockaddr)。

　　struct sockaddr结构类型是用来保存socket信息的：

　　struct sockaddr {

　　unsigned short sa_family; /* 地址族， AF_xxx */

　　char sa_data[14]; /* 14 字节的协议地址 */

　　};

　　sa_family一般为AF_INET，代表Internet（TCP/IP）地址族；

　　sa_data则包含该socket的IP地址和端口号。

　　另外还有一种结构类型：

　　struct sockaddr_in {

　　short int sin_family; /* 地址族 */

　　unsigned short int sin_port; /* 端口号 */

　　struct in_addr sin_addr; /* IP地址 */

　　unsigned char sin_zero[8]; /* 填充0
以保持与struct sockaddr同样大小 */

　　};

　　这个结构更方便使用。sin_zero用来将sockaddr_in结构填充到与struct sockaddr同样的长度，可以用bzero()或memset()函数将其置为零。指向sockaddr_in
的指针和指向sockaddr的指针可以相互转换，这意味着如果一个函数所需参数类型是sockaddr时，你可以在函数调用的时候将一个指向 sockaddr_in的指针转换为指向sockaddr的指针；或者相反。

　　使用bind函数时，可以用下面的赋值实现自动获得本机IP地址和随机获取一个没有被占用的端口号：

　　my_addr.sin_port = 0; /* 系统随机选择一个未被使用的端口号 */

　　my_addr.sin_addr.s_addr = INADDR_ANY; /* 填入本机IP地址 */

　　通过将my_addr.sin_port置为0，函数会自动为你选择一个未占用的端口来使用。同样，通过将my_addr.sin_addr.s_addr置为INADDR_ANY，系统会自动填入本机IP地址。

　　注意在使用bind函数是需要将sin_port和sin_addr转换成为网络字节优先顺序。

　　计算机数据存储有两种字节优先顺序：高位字节优先和低位字节优先(大端和小端)。Internet上数据以高位字节优先顺序在网络上传输，所以对于在内部是以低位字节优先方式存储数据的机器，在Internet上传输数据时就需要进行转换，否则就会出现数据不一致。

　　下面是几个字节顺序转换函数：

　　·htonl()：把32位值从主机字节序转换成网络字节序

　　·htons()：把16位值从主机字节序转换成网络字节序

　　·ntohl()：把32位值从网络字节序转换成主机字节序

　　·ntohs()：把16位值从网络字节序转换成主机字节序

　　Bind()函数在成功被调用时返回0；出现错误时返回"-1"并将errno置为相应的错误号。

　　需要注意的是，在调用bind函数时一般不要将端口号置为小于1024的值，因为1到1024是保留端口号，你可以选择大于1024中的任何一个没有被占用的端口号。

　　四、连接

　　面向连接的客户程序使用connect函数来配置socket并与远端服务器建立一个TCP连接，其函数原型为：

　　include

　　include

　　int connect(int sock_fd, struct sockaddr *serv_addr,int addrlen);

　　功能说明：客户端发送服务请求。成功返回0，否则返回－1，并置errno。

　　参数说明：sock_fd 是socket函数返回的socket描述符；serv_addr是包含远端主机IP地址和端口号的指针；addrlen是远端地质结构的长度。

　　进行客户端程序设计无须调用bind()，因为这种情况下只需知道目的机器的IP地址，而客户通过哪个端口与服务器建立连接并不需要关心，
socket执行体为你的程序自动选择一个未被占用的端口，并通知你的程序数据什么时候到端口。

　　connect函数启动和远端主机的直接连接。只有面向连接的客户程序使用socket时才需要将此socket与远端主机相连。无连接协议从不建立直接连接。面向连接的服务器也从不启动一个连接，它只是被动的在协议端口监听客户的请求。

　　五、监听

　　Listen函数使socket处于被动的监听模式，并为该socket建立一个输入数据队列，将到达的服务请求保存在此队列中，直到程序处理它们。

　　include

　　int listen(int sock_fd， int backlog);

　　功能说明：等待指定的端口的出现客户端连接。调用成功返回0，否则，返回－1，并置errno.

　　参数说明：sock_fd 是socket系统调用返回的socket
描述符；

　　backlog指定在请求队列中允许的最大请求数，进入的连接请求将在队列中等待accept()它们（参考下文）。

　　Backlog对队列中等待服务的请求的数目进行了限制，大多数系统缺省值为20。如果一个服务请求到来时，输入队列已满，该socket将拒绝连接请求，客户将收到一个出错信息。

　　六、接受

　　accept()函数让服务器接收客户的连接请求。在建立好输入队列后，服务器就调用accept函数，然后睡眠并等待客户的连接请求。

　　include

　　include

　　int accept(int sock_fd, void *addr, int *addrlen);

　　功能说明：用于接受客户端的服务请求，成功返回新的套接字描述符，失败返回－1，并置errno。

　　参数说明：sock_fd是被监听的socket描述符，addr通常是一个指向sockaddr_in变量的指针，该变量用来存放提出连接请求服务的主机的信息（某台主机从某个端口发出该请求）；addrten通常为一个指向值为sizeof(struct
sockaddr_in)的整型指针变量。出现错误时accept函数返回-1并置相应的errno值。

　　首先，当accept函数监视的 socket收到连接请求时，socket执行体将建立一个新的socket，执行体将这个新socket和请求连接进程的地址联系起来，收到服务请求的初始socket仍可以继续在以前的
socket上监听，同时可以在新的socket描述符上进行数据传输操作。

　　七、数据传输

　　send()和recv()这两个函数用于面向连接的socket上进行数据传输。

　　send()函数原型为：

　　include

　　include

　　size_t send(int sock_fd, const void *msg, int len, int flags);

　　功能说明：发送数据。成功返回实际反送的数据的字节数。失败返回－1，并置errno.

　　参数说明： sock_fd是你想用来传输数据的socket描述符；msg是一个指向要发送数据的指针；len是以字节为单位的数据的长度；flags一般情况下置为0（关于该参数的用法可参照man手册）。

　　send()函数返回实际上发送出的字节数，可能会少于你希望发送的数据。在程序中应该将send()的返回值与欲发送的字节数进行比较。当send()返回值与len不匹配时，应该对这种情况进行处理。

　　char *msg = "Hello!";

　　int len, bytes_sent;

　　……

　　len = strlen(msg);

　　bytes_sent = send(sockfd, msg,len,0);

　　……

　　recv()函数原型为：

　　include

　　include

　　int recv(int sock_fd,void *buf,int len,unsigned int flags);

　　功能说明：接受数据，成功返回0，否则，返回－1，并设置errno。

　　参数说明：sock_fd是接受数据的socket描述符；buf
是存放接收数据的缓冲区；len是缓冲的长度。flags也被置为0。recv()返回实际上接收的字节数.

　　sendto()和recvfrom()用于在无连接的数据报socket方式下进行数据传输。由于本地socket并没有与远端机器建立连接，所以在发送数据时应指明目的地址。

　　sendto()函数原型为：

　　int sendto(int sockfd, const void *msg,int len,unsigned int flags,const struct sockaddr *to, int tolen);

　　该函数比send()函数多了两个参数，to表示目地机的IP地址和端口号信息，而tolen常常被赋值为sizeof (struct sockaddr)。sendto
函数也返回实际发送的数据字节长度或在出现发送错误时返回-1。

　　recvfrom()函数原型为：

　　int recvfrom(int sockfd,void *buf,int len,unsigned int flags,struct sockaddr *from,int *fromlen);

　　from是一个struct sockaddr类型的变量，该变量保存源机的IP地址及端口号。fromlen常置为sizeof (struct sockaddr)。当recvfrom()返回时，fromlen包含实际存入from中的数据字节数。Recvfrom()函数返回接收到的字节数或当出现错误时返回-1，并置相应的errno。

　　如果你对数据报socket调用了connect()函数时，你也可以利用send()和recv()进行数据传输，但该socket仍然是数据报socket，并且利用传输层的UDP服务。但在发送或接收数据报时，内核会自动为之加上目地和源地址信息。

　　八、结束传输

　　当所有的数据操作结束以后，你可以调用close()函数来释放该socket，从而停止在该socket上的任何数据操作：

　　int close(sock_fd);

　　你也可以调用shutdown()函数来关闭该socket。该函数允许你只停止在某个方向上的数据传输，而一个方向上的数据传输继续进行。如你可以关闭某socket的写操作而允许继续在该socket上接受数据，直至读入所有数据。

　　int shutdown(int sock_fd,int how);

　　sockfd是需要关闭的socket的描述符。参数 how允许为shutdown操作选择以下几种方式：

　　·0-------不允许继续接收数据

　　·1-------不允许继续发送数据

　　·2-------不允许继续发送和接收数据，

　　·均为允许则调用close ()

　　shutdown在操作成功时返回0，在出现错误时返回-1并置相应errno。

　　socket编程实例

　　代码实例中的服务器通过socket连接向客户端发送字符串"Hello, you are connected!"。只要在服务器上运行该服务器软件，在客户端运行客户软件，客户端就会收到该字符串。

　　该服务器软件代码如下：

　　#include

　　#include

　　#include

　　#include

　　#include

　　#include

　　#include

　　#include

　　#define SERVPORT 3333 /*服务器监听端口号 */

　　#define BACKLOG 10 /* 最大同时连接请求数 */

　　int main()

　　{

　　int sock_fd,client_fd; /*sock_fd：监听socket；client_fd：数据传输socket */

　　struct sockaddr_in my_addr; /* 本机地址信息 */

　　struct sockaddr_in remote_addr; /* 客户端地址信息 */

　　if ((sock_fd = socket(AF_INET, SOCK_STREAM, 0)) == -1) {

　　perror("socket创建出错！");

　　exit(1);

　　}

　　my_addr.sin_family=AF_INET;

　　my_addr.sin_port=htons(SERVPORT);

　　my_addr.sin_addr.s_addr = INADDR_ANY;

　　bzero(&(my_addr.sin_zero),8);

　　if (bind(sock_fd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr)) == -1) {

　　perror("bind出错！");

　　exit(1);

　　}

　　if (listen(sock_fd, BACKLOG) == -1) {

　　perror("listen出错！");

　　exit(1);

　　}

　　while(1) {

　　sin_size = sizeof(struct sockaddr_in);

　　if ((client_fd = accept(sock_fd, (struct sockaddr *)&remote_addr, &sin_size)) == -1) {

　　perror("accept出错");

　　continue;

　　}

　　printf("received a connection from %s\n", inet_ntoa(remote_addr.sin_addr));

　　if (!fork()) { /* 子进程代码段 */

　　if (send(client_fd, "Hello, you are connected!\n", 26, 0) == -1)

　　perror("send出错！");

　　close(client_fd);

　　exit(0);

　　}

　　close(client_fd);

　　}

　　}

　　return 0;

　　}

　　服务器的工作流程是这样的：

　　1.调用socket函数创建一个socket;

　　2.然后调用bind函数将其与本机地址以及一个本地端口号绑定;

　　3.然后调用 listen在相应的socket上监听，当accpet接收到一个连接服务请时，将生成一个新的socket。服务器显示该客户机的IP地址，并通过新的socket向客户端发送字符串"Hello，you
are connected!"。最后关闭该socket。

　　客户端程序代码如下：

　　#include

　　#include

　　#include

　　#include

　　#include

　　#include

　　#include

　　#include

　　#define SERVPORT 3333

　　#define MAXDATASIZE 100 /*每次最大数据传输量 */

　　int main(int argc, char *argv[])

　　{

　　int sock_fd, recvbytes;

　　char buf[MAXDATASIZE];

　　struct hostent *host;

　　struct sockaddr_in serv_addr;

　　if (argc

　　if((host=gethostbyname(argv[1]))==NULL) {

　　herror("gethostbyname出错！");

　　exit(1);

　　}

　　if ((sock_fd = socket(AF_INET, SOCK_STREAM, 0)) == -1){

　　perror("socket创建出错！");

　　exit(1);

　　}

　　serv_addr.sin_family=AF_INET;

　　serv_addr.sin_port=htons(SERVPORT);

　　serv_addr.sin_addr = *((struct in_addr *)host->h_addr);

　　bzero(&(serv_addr.sin_zero),8);

　　if (connect(sock_fd, (struct sockaddr *)&serv_addr, \

　　sizeof(struct sockaddr)) == -1) {

　　perror("connect出错！");

　　exit(1);

　　}

　　if ((recvbytes=recv(sock_fd, buf, MAXDATASIZE, 0)) ==-1) {

　　perror("recv出错！");

　　exit(1);

　　}

　　buf[recvbytes] = '\0';

　　printf("Received: %s",buf);

　　close(sock_fd);

　　}

　　客户端程序首先通过服务器域名获得服务器的IP地址，然后创建一个socket，调用connect函数与服务器建立连接，连接成功之后接收从服务器发送过来的数据，最后关闭socket。

　　struct hostent *gethostbyname(const char *name);

　　功能：完成域名转换，将域名转化为IP地址；

　　参数说明：name为需要转换的域名

　　返回值：调用成功时，hosten结构类型指针；失败时，返回－1，可用herror()函数输出错误原因.

　　hosten结构为：

　　struct hostent {

　　char *h_name; /* 主机的官方域名 */

　　char **h_aliases; /* 一个以NULL结尾的主机别名数组 */

　　int h_addrtype; /* 返回的地址类型，在Internet环境下为AF-INET */

　　int h_length; /* 地址的字节长度 */

　　char **h_addr_list; /* 一个以0结尾的数组，包含该主机的所有地址*/

　　};

　　#define h_addr h_addr_list[0] /*在h-addr-list中的第一个地址*/

　　无连接的客户/服务器程序的在原理上和连接的客户/服务器是一样的，两者的区别在于无连接的客户/服务器中的客户一般不需要建立连接，而且在发送接收数据时，需要指定远端机的地址。

　　阻塞和非阻塞

　　阻塞函数在完成其指定的任务以前不允许程序调用另一个函数。例如，程序执行一个读数据的函数调用时，在此函数完成读操作以前将不会执行下一程序语句。当服务器运行到accept语句时，而没有客户连接服务请求到来，服务器就会停止在accept语句上等待连接服务请求的到来。这种情况称为阻塞（blocking）。而非阻塞操作则可以立即完成。比如，如果你希望服务器仅仅注意检查是否有客户在等待连接，有就接受连接，否则就继续做其他事情，则可以通过将socket设置为非阻塞方式来实现。非阻塞socket在没有客户在等待时就使accept调用立即返回。

　　#include

　　#include

　　……

　　sock_fd = socket(AF_INET,SOCK_STREAM,0);

　　fcntl(sock_fd,F_SETFL,O_NONBLOCK)；

　　……

　　通过设置socket为非阻塞方式，可以实现"轮询"若干socket。当企图从一个没有数据等待处理的非阻塞socket读入数据时，函数将立即返回-1，并置errno值为EWOULDBLOCK.但是这种"轮询"会使CPU处于忙等待方式，从而降低性能，浪费系统资源。而调用
select()会有效地解决这个问题，它允许你把进程本身挂起来，而同时使系统内核监听所要求的一组文件描述符的任何活动，只要确认在任何被监控的文件描述符上出现活动，select()调用将返回指示该文件描述符已准备好的信息，从而实现了为进程选出随机的变化，而不必由进程本身对输入进行测试而浪费
CPU开销。Select函数原型为:

　　int select(int numfds,fd_set *readfds,fd_set *writefds，

　　fd_set *exceptfds,struct timeval *timeout);

　　其中readfds、writefds、exceptfds分别是被select()监视的读、写和异常处理的文件描述符集合。如果你希望确定是否可以从标准输入和某个socket描述符读取数据，你只需要将标准输入的文件描述符0和相应的socket_fd加入到readfds集合中；numfds的值是需要检查的号码最高的文件描述符加1，这个例子中numfds的值应为sockfd+1；当select返回时，readfds将被修改，指示某个文件描述符已经准备被读取，你可以通过FD_ISSSET()来测试。为了实现fd_set中对应的文件描述符的设置、复位和测试，它提供了一组宏：

　　FD_ZERO(fd_set *set)----清除一个文件描述符集；

　　FD_SET(int fd,fd_set *set)----将一个文件描述符加入文件描述符集中；

　　FD_CLR(int fd,fd_set *set)----将一个文件描述符从文件描述符集中清除；

　　FD_ISSET(int fd,fd_set *set)----试判断是否文件描述符被置位。

　　timeout参数是一个指向struct timeval类型的指针，它可以使select()在等待timeout长时间后没有文件描述符准备好即返回。struct timeval数据结构为：

　　struct timeval {

　　int tv_sec; /* seconds */

　　int tv_usec; /* microseconds */

　　};

struct sockaddr {
　　unsigned short int sa_family; /* address family, AF_xxx */

　　char sa_data[14]; /* address */

　　};

　　sa_family是地址家族，是“AF_xxx”的形式。常设为“AF_INET”，代表Internet（TCP/IP）地址族。

　　sa_data是协议地址，由sa_family决定。如果sa_family=AF_INET，则sa_data就是sockaddr_in的sin_addr和sin_port。换句话说，这时sockaddr可以当作sockaddr_in看。

　　struct sockaddr_in {

　　short int sin_family; /* Address family */

　　unsigned short int sin_port; /* Port number */

　　struct in_addr sin_addr; /* Internet address */

　　unsigned char sin_zero[8]; /*to make same size as struct sockaddr */

　　};

　　struct in_addr {

　　unsigned long s_addr;

　　};

　　sin_family意义与sa_family同。

　　sin_port存储端口号（使用网络字节顺序）

　　sin_addr存储IP地址，使用in_addr这个数据结构

　　sin_zero是为了让sockaddr与sockaddr_in两个数据结构保持大小相同而保留的空字节。

　　在 in_addr结构体中，s_addr按照网络字节顺序存储IP地址。

　　sin_zero用来将sockaddr_in结构填充到与struct sockaddr同样的长度，可以用bzero()或memset()函数将其置为零。指向sockaddr_in的指针和指向sockaddr的指针可以相互转换，这意味着如果一个函数所需参数类型是sockaddr类型时，你可以在函数调用的时候将一个指向sockaddr_in的指针转换为指向 sockaddr的指针；或者相反。

\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\

struct sockaddr {

unsigned short sa_family;

char sa_data[14];

};

此数据结构用做bind、connect、recvfrom、sendto等函数的参数，指明地址信息。

但一般编程中并不直接针对此数据结构操作，而是使用另一个与sockaddr等价的数据结构

sockaddr_in（在netinet/in.h中定义）：

struct sockaddr_in {

short int sin_family;

unsigned short int sin_port;

struct in_addr sin_addr;

unsigned char sin_zero[8];

};

struct in_addr {

unsigned long s_addr;

};

typedef struct in_addr {

union {

struct{

unsigned char s_b1,

s_b2,

s_b3,

s_b4;

} S_un_b;

struct{

unsigned short s_w1,

s_w2;

} S_un_w;

unsigned long S_addr;

}S_un;

} IN_ADDR;

sin_family指代协议族，在socket编程中只能是AF_INET

sin_port存储端口号（使用网络字节顺序）

sin_addr存储IP地址，使用in_addr这个数据结构

sin_zero是为了让sockaddr与sockaddr_in两个数据结构保持大小相同而保留的空字节。

s_addr按照网络字节顺序存储IP地址

sockaddr_in和sockaddr是并列的结构，指向sockaddr_in的结构体的指针也可以指向

sockadd的结构体，并代替它。也就是说，你可以使用sockaddr_in建立你所需要的信息,

在最后用进行类型转换就可以了bzero((char*)&mysock,sizeof(mysock));//初始化

mysock结构体名

mysock.sa_family=AF_INET;

mysock.sin_addr.s_addr=inet_addr("192.168.0.1");

……

等到要做转换的时候用：

（struct sockaddr*）mysock

想来你是要进行网络编程，使用socket, listen, bind等函数。

你只要记住，填值的时候使用sockaddr_in结构，而作为函数的参数传入的时候转换成sockaddr结构就行了，毕竟都是16个字符长。

IP地址和如何处理它们

现在我们很幸运，因为我们有很多的函数来方便地操作 IP 地址。没有必要用手工计算它们，也没有必要用"<<"操作来储存成长整字型。首先，假设你已经有了一个sockaddr_in结构体ina，你有一个IP地址"132.241.5.10"要储存在其中，你就要用到函数inet_addr(),将IP地址从点数格式转换成无符号长整型。使用方法如下：

ina.sin_addr.s_addr = inet_addr("132.241.5.10");

注意，inet_addr()返回的地址已经是网络字节格式，所以你无需再调用函数htonl()。

我们现在发现上面的代码片断不是十分完整的，因为它没有错误检查。显而易见，当inet_addr()发生错误时返回-1。记住这些二进制数字？(无符号数)-1仅仅和IP地址255.255.255.255相符合！这可是广播地址！大错特错！记住要先进行错误检查。

好了，现在你可以将IP地址转换成长整型了。有没有其相反的方法呢？它可以将一个in_addr结构体输出成点数格式？这样的话，你就要用到函数 inet_ntoa()("ntoa"的含义是"network to ascii")，就像这样：

printf("%s",inet_ntoa(ina.sin_addr));

它将输出IP地址。需要注意的是inet_ntoa()将结构体in-addr作为一个参数，不是长整形。同样需要注意的是它返回的是一个指向一个字符的指针。它是一个由inet_ntoa()控制的静态的固定的指针，所以每次调用 inet_ntoa()，它就将覆盖上次调用时所得的IP地址。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航