您的位置:首页 > 运维架构 > Linux

Linux Socket编程(不限Linux)

2013-07-01 21:49 507 查看
“一切皆Socket!”

话虽些许夸张,但是事实也是,现在的网络编程几乎都是用的socket。

——有感于实际编程和开源项目研究。

我们深谙信息交流的价值,那网络中进程之间如何通信,如我们每天打开浏览器浏览网页时,浏览器的进程怎么与web服务器通信的?当你用QQ聊天时,QQ进程怎么与服务器或你好友所在的QQ进程通信?这些都得靠socket?那什么是socket?socket的类型有哪些?还有socket的基本函数,这些都是本文想介绍的。本文的主要内容如下:

[align=justify]1、网络中进程之间如何通信?[/align]

[align=justify]2、Socket是什么?[/align]

[align=justify]3、socket的基本操作[/align]

[align=justify]3.1、socket()函数[/align]

[align=justify]3.2、bind()函数[/align]

[align=justify]3.3、listen()、connect()函数[/align]

[align=justify]3.4、accept()函数[/align]

[align=justify]3.5、read()、write()函数等[/align]

[align=justify]3.6、close()函数[/align]

[align=justify]4、socket中TCP的三次握手建立连接详解[/align]

[align=justify]5、socket中TCP的四次握手释放连接详解[/align]

[align=justify]6、一个例子(实践一下)[/align]

7、留下一个问题,欢迎大家回帖回答!!!

1、网络中进程之间如何通信?

本地的进程间通信(IPC)有很多种方式,但可以总结为下面4类:

[align=justify]消息传递(管道、FIFO、消息队列)[/align]

[align=justify]同步(互斥量、条件变量、读写锁、文件和写记录锁、信号量)[/align]

[align=justify]共享内存(匿名的和具名的)[/align]

[align=justify]远程过程调用(Solaris门和Sun RPC)[/align]

但这些都不是本文的主题!我们要讨论的是网络中进程之间如何通信?首要解决的问题是如何唯一标识一个进程,否则通信无从谈起!在本地可以通过进程PID来唯一标识一个进程,但是在网络中这是行不通的。其实TCP/IP协议族已经帮我们解决了这个问题,网络层的“ip地址”可以唯一标识网络中的主机,而传输层的“协议+端口”可以唯一标识主机中的应用程序(进程)。这样利用三元组(ip地址,协议,端口)就可以标识网络的进程了,网络中的进程通信就可以利用这个标志与其它进程进行交互。

使用TCP/IP协议的应用程序通常采用应用编程接口:UNIX BSD的套接字(socket)和UNIX System V的TLI(已经被淘汰),来实现网络进程之间的通信。就目前而言,几乎所有的应用程序都是采用socket,而现在又是网络时代,网络中进程通信是无处不在,这就是我为什么说“一切皆socket”。

2、什么是Socket?

上面我们已经知道网络中的进程是通过socket来通信的,那什么是socket呢?socket起源于Unix,而Unix/Linux基本哲学之一就是“一切皆文件”,都可以用“打开open –> 读写write/read –> 关闭close”模式来操作。我的理解就是Socket就是该模式的一个实现,socket即是一种特殊的文件,一些socket函数就是对其进行的操作(读/写IO、打开、关闭),这些函数我们在后面进行介绍。

socket一词的起源

在组网领域的首次使用是在1970年2月12日发布的文献IETF
RFC33中发现的,撰写者为Stephen Carr、Steve Crocker和Vint Cerf。根据美国计算机历史博物馆的记载,Croker写道:“命名空间的元素都可称为套接字接口。一个套接字接口构成一个连接的一端,而一个连接可完全由一对套接字接口规定。”计算机历史博物馆补充道:“这比BSD的套接字接口定义早了大约12年。”

3、socket的基本操作

既然socket是“open—write/read—close”模式的一种实现,那么socket就提供了这些操作对应的函数接口。下面以TCP为例,介绍几个基本的socket接口函数。


3.1、socket()函数

int socket(int domain, int type, int protocol);


socket函数对应于普通文件的打开操作。普通文件的打开操作返回一个文件描述字,而socket()用于创建一个socket描述符(socket descriptor),它唯一标识一个socket。这个socket描述字跟文件描述字一样,后续的操作都有用到它,把它作为参数,通过它来进行一些读写操作。

正如可以给fopen的传入不同参数值,以打开不同的文件。创建socket的时候,也可以指定不同的参数创建不同的socket描述符,socket函数的三个参数分别为:

domain:即协议域,又称为协议族(family)。常用的协议族有,AF_INET、AF_INET6、AF_LOCAL(或称AF_UNIX,Unix域socket)、AF_ROUTE等等。协议族决定了socket的地址类型,在通信中必须采用对应的地址,如AF_INET决定了要用ipv4地址(32位的)与端口号(16位的)的组合、AF_UNIX决定了要用一个绝对路径名作为地址。

type:指定socket类型。常用的socket类型有,SOCK_STREAM、SOCK_DGRAM、SOCK_RAW、SOCK_PACKET、SOCK_SEQPACKET等等(socket的类型有哪些?)。

protocol:故名思意,就是指定协议。常用的协议有,IPPROTO_TCP、IPPTOTO_UDP、IPPROTO_SCTP、IPPROTO_TIPC等,它们分别对应TCP传输协议、UDP传输协议、STCP传输协议、TIPC传输协议(这个协议我将会单独开篇讨论!)。

注意:并不是上面的type和protocol可以随意组合的,如SOCK_STREAM不可以跟IPPROTO_UDP组合。当protocol为0时,会自动选择type类型对应的默认协议。

当我们调用socket创建一个socket时,返回的socket描述字它存在于协议族(address family,AF_XXX)空间中,但没有一个具体的地址。如果想要给它赋值一个地址,就必须调用bind()函数,否则就当调用connect()、listen()时系统会自动随机分配一个端口。


3.2、bind()函数

正如上面所说bind()函数把一个地址族中的特定地址赋给socket。例如对应AF_INET、AF_INET6就是把一个ipv4或ipv6地址和端口号组合赋给socket。

int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);


函数的三个参数分别为:

sockfd:即socket描述字,它是通过socket()函数创建了,唯一标识一个socket。bind()函数就是将给这个描述字绑定一个名字。

addr:一个const struct sockaddr *指针,指向要绑定给sockfd的协议地址。这个地址结构根据地址创建socket时的地址协议族的不同而不同,如ipv4对应的是:

struct sockaddr_in {
sa_family_t    sin_family; /* address family: AF_INET */
in_port_t      sin_port;   /* port in network byte order */
struct in_addr sin_addr;   /* internet address */
};

/* Internet address. */
struct in_addr {
uint32_t       s_addr;     /* address in network byte order */
};


ipv6对应的是:

struct sockaddr_in6 {
sa_family_t     sin6_family;   /* AF_INET6 */
in_port_t       sin6_port;     /* port number */
uint32_t        sin6_flowinfo; /* IPv6 flow information */
struct in6_addr sin6_addr;     /* IPv6 address */
uint32_t        sin6_scope_id; /* Scope ID (new in 2.4) */
};

struct in6_addr {
unsigned char   s6_addr[16];   /* IPv6 address */
};


Unix域对应的是:

#define UNIX_PATH_MAX    108

struct sockaddr_un {
sa_family_t sun_family;               /* AF_UNIX */
char        sun_path[UNIX_PATH_MAX];  /* pathname */
};


addrlen:对应的是地址的长度。

通常服务器在启动的时候都会绑定一个众所周知的地址(如ip地址+端口号),用于提供服务,客户就可以通过它来接连服务器;而客户端就不用指定,有系统自动分配一个端口号和自身的ip地址组合。这就是为什么通常服务器端在listen之前会调用bind(),而客户端就不会调用,而是在connect()时由系统随机生成一个。

网络字节序与主机字节序

主机字节序就是我们平常说的大端和小端模式:不同的CPU有不同的字节序类型,这些字节序是指整数在内存中保存的顺序,这个叫做主机序。引用标准的Big-Endian和Little-Endian的定义如下:

  a) Little-Endian就是低位字节排放在内存的低地址端,高位字节排放在内存的高地址端。

  b) Big-Endian就是高位字节排放在内存的低地址端,低位字节排放在内存的高地址端。

网络字节序:4个字节的32 bit值以下面的次序传输:首先是0~7bit,其次8~15bit,然后16~23bit,最后是24~31bit。这种传输次序称作大端字节序。由于TCP/IP首部中所有的二进制整数在网络中传输时都要求以这种次序,因此它又称作网络字节序。字节序,顾名思义字节的顺序,就是大于一个字节类型的数据在内存中的存放顺序,一个字节的数据没有顺序的问题了。

所以:在将一个地址绑定到socket的时候,请先将主机字节序转换成为网络字节序,而不要假定主机字节序跟网络字节序一样使用的是Big-Endian。由于这个问题曾引发过血案!公司项目代码中由于存在这个问题,导致了很多莫名其妙的问题,所以请谨记对主机字节序不要做任何假定,务必将其转化为网络字节序再赋给socket。


3.3、listen()、connect()函数

如果作为一个服务器,在调用socket()、bind()之后就会调用listen()来监听这个socket,如果客户端这时调用connect()发出连接请求,服务器端就会接收到这个请求。

int listen(int sockfd, int backlog);
int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);


listen函数的第一个参数即为要监听的socket描述字,第二个参数为相应socket可以排队的最大连接个数。socket()函数创建的socket默认是一个主动类型的,listen函数将socket变为被动类型的,等待客户的连接请求。

connect函数的第一个参数即为客户端的socket描述字,第二参数为服务器的socket地址,第三个参数为socket地址的长度。客户端通过调用connect函数来建立与TCP服务器的连接。


3.4、accept()函数

TCP服务器端依次调用socket()、bind()、listen()之后,就会监听指定的socket地址了。TCP客户端依次调用socket()、connect()之后就想TCP服务器发送了一个连接请求。TCP服务器监听到这个请求之后,就会调用accept()函数取接收请求,这样连接就建立好了。之后就可以开始网络I/O操作了,即类同于普通文件的读写I/O操作。

int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);


accept函数的第一个参数为服务器的socket描述字,第二个参数为指向struct sockaddr *的指针,用于返回客户端的协议地址,第三个参数为协议地址的长度。如果accpet成功,那么其返回值是由内核自动生成的一个全新的描述字,代表与返回客户的TCP连接。

注意:accept的第一个参数为服务器的socket描述字,是服务器开始调用socket()函数生成的,称为监听socket描述字;而accept函数返回的是已连接的socket描述字。一个服务器通常通常仅仅只创建一个监听socket描述字,它在该服务器的生命周期内一直存在。内核为每个由服务器进程接受的客户连接创建了一个已连接socket描述字,当服务器完成了对某个客户的服务,相应的已连接socket描述字就被关闭。


3.5、read()、write()等函数

万事具备只欠东风,至此服务器与客户已经建立好连接了。可以调用网络I/O进行读写操作了,即实现了网咯中不同进程之间的通信!网络I/O操作有下面几组:

read()/write()

recv()/send()

readv()/writev()

recvmsg()/sendmsg()

recvfrom()/sendto()

我推荐使用recvmsg()/sendmsg()函数,这两个函数是最通用的I/O函数,实际上可以把上面的其它函数都替换成这两个函数。它们的声明如下:

#include <unistd.h>

ssize_t read(int fd, void *buf, size_t count);
ssize_t write(int fd, const void *buf, size_t count);

#include <sys/types.h>
#include <sys/socket.h>

ssize_t send(int sockfd, const void *buf, size_t len, int flags);
ssize_t recv(int sockfd, void *buf, size_t len, int flags);

ssize_t sendto(int sockfd, const void *buf, size_t len, int flags,
const struct sockaddr *dest_addr, socklen_t addrlen);
ssize_t recvfrom(int sockfd, void *buf, size_t len, int flags,
struct sockaddr *src_addr, socklen_t *addrlen);

ssize_t sendmsg(int sockfd, const struct msghdr *msg, int flags);
ssize_t recvmsg(int sockfd, struct msghdr *msg, int flags);


read函数是负责从fd中读取内容.当读成功时,read返回实际所读的字节数,如果返回的值是0表示已经读到文件的结束了,小于0表示出现了错误。如果错误为EINTR说明读是由中断引起的,如果是ECONNREST表示网络连接出了问题。

write函数将buf中的nbytes字节内容写入文件描述符fd.成功时返回写的字节数。失败时返回-1,并设置errno变量。 在网络程序中,当我们向套接字文件描述符写时有俩种可能。1)write的返回值大于0,表示写了部分或者是全部的数据。2)返回的值小于0,此时出现了错误。我们要根据错误类型来处理。如果错误为EINTR表示在写的时候出现了中断错误。如果为EPIPE表示网络连接出现了问题(对方已经关闭了连接)。

其它的我就不一一介绍这几对I/O函数了,具体参见man文档或者baidu、Google,下面的例子中将使用到send/recv。


3.6、close()函数

在服务器与客户端建立连接之后,会进行一些读写操作,完成了读写操作就要关闭相应的socket描述字,好比操作完打开的文件要调用fclose关闭打开的文件。

#include <unistd.h>
int close(int fd);


close一个TCP socket的缺省行为时把该socket标记为以关闭,然后立即返回到调用进程。该描述字不能再由调用进程使用,也就是说不能再作为read或write的第一个参数。

注意:close操作只是使相应socket描述字的引用计数-1,只有当引用计数为0的时候,才会触发TCP客户端向服务器发送终止连接请求。

4、socket中TCP的三次握手建立连接详解

我们知道tcp建立连接要进行“三次握手”,即交换三个分组。大致流程如下:

客户端向服务器发送一个SYN J

服务器向客户端响应一个SYN K,并对SYN J进行确认ACK J+1

客户端再想服务器发一个确认ACK K+1

只有就完了三次握手,但是这个三次握手发生在socket的那几个函数中呢?请看下图:





图1、socket中发送的TCP三次握手

从图中可以看出,当客户端调用connect时,触发了连接请求,向服务器发送了SYN J包,这时connect进入阻塞状态;服务器监听到连接请求,即收到SYN J包,调用accept函数接收请求向客户端发送SYN
K ,ACK J+1,这时accept进入阻塞状态;客户端收到服务器的SYN K ,ACK J+1之后,这时connect返回,并对SYN K进行确认;服务器收到ACK K+1时,accept返回,至此三次握手完毕,连接建立。

总结:客户端的connect在三次握手的第二个次返回,而服务器端的accept在三次握手的第三次返回。

5、socket中TCP的四次握手释放连接详解

上面介绍了socket中TCP的三次握手建立过程,及其涉及的socket函数。现在我们介绍socket中的四次握手释放连接的过程,请看下图:





图2、socket中发送的TCP四次握手

图示过程如下:

[align=left]某个应用进程首先调用close主动关闭连接,这时TCP发送一个FIN M;[/align]

[align=left]另一端接收到FIN M之后,执行被动关闭,对这个FIN进行确认。它的接收也作为文件结束符传递给应用进程,因为FIN的接收意味着应用进程在相应的连接上再也接收不到额外数据;[/align]

[align=left]一段时间之后,接收到文件结束符的应用进程调用close关闭它的socket。这导致它的TCP也发送一个FIN N;[/align]

[align=left]接收到这个FIN的源发送端TCP对它进行确认。[/align]

这样每个方向上都有一个FIN和ACK。

6、一个例子(实践一下)

说了这么多了,动手实践一下。下面编写一个简单的服务器、客户端(使用TCP)——服务器端一直监听本机的6666号端口,如果收到连接请求,将接收请求并接收客户端发来的消息;客户端与服务器端建立连接并发送一条消息。

服务器端代码:





#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#include<errno.h>
#include<sys/types.h>
#include<sys/socket.h>
#include<netinet/in.h>

#define MAXLINE 4096

int main(int argc, char** argv)
{
int    listenfd, connfd;
struct sockaddr_in     servaddr;
char    buff[4096];
int     n;

if( (listenfd = socket(AF_INET, SOCK_STREAM, 0)) == -1 ){
printf("create socket error: %s(errno: %d)\n",strerror(errno),errno);
exit(0);
}

memset(&servaddr, 0, sizeof(servaddr));
servaddr.sin_family = AF_INET;
servaddr.sin_addr.s_addr = htonl(INADDR_ANY);
servaddr.sin_port = htons(6666);

if( bind(listenfd, (struct sockaddr*)&servaddr, sizeof(servaddr)) == -1){
printf("bind socket error: %s(errno: %d)\n",strerror(errno),errno);
exit(0);
}

if( listen(listenfd, 10) == -1){
printf("listen socket error: %s(errno: %d)\n",strerror(errno),errno);
exit(0);
}

printf("======waiting for client's request======\n");
while(1){
if( (connfd = accept(listenfd, (struct sockaddr*)NULL, NULL)) == -1){
printf("accept socket error: %s(errno: %d)",strerror(errno),errno);
continue;
}
n = recv(connfd, buff, MAXLINE, 0);
buff
= '\0';
printf("recv msg from client: %s\n", buff);
close(connfd);
}

close(listenfd);
}





客户端代码:





#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#include<errno.h>
#include<sys/types.h>
#include<sys/socket.h>
#include<netinet/in.h>

#define MAXLINE 4096

int main(int argc, char** argv)
{
int    sockfd, n;
char    recvline[4096], sendline[4096];
struct sockaddr_in    servaddr;

if( argc != 2){
printf("usage: ./client <ipaddress>\n");
exit(0);
}

if( (sockfd = socket(AF_INET, SOCK_STREAM, 0)) < 0){
printf("create socket error: %s(errno: %d)\n", strerror(errno),errno);
exit(0);
}

memset(&servaddr, 0, sizeof(servaddr));
servaddr.sin_family = AF_INET;
servaddr.sin_port = htons(6666);
if( inet_pton(AF_INET, argv[1], &servaddr.sin_addr) <= 0){
printf("inet_pton error for %s\n",argv[1]);
exit(0);
}

if( connect(sockfd, (struct sockaddr*)&servaddr, sizeof(servaddr)) < 0){
printf("connect error: %s(errno: %d)\n",strerror(errno),errno);
exit(0);
}

printf("send msg to server: \n");
fgets(sendline, 4096, stdin);
if( send(sockfd, sendline, strlen(sendline), 0) < 0)
{
printf("send msg error: %s(errno: %d)\n", strerror(errno), errno);
exit(0);
}

close(sockfd);
exit(0);
}





当然上面的代码很简单,也有很多缺点,这就只是简单的演示socket的基本函数使用。其实不管有多复杂的网络程序,都使用的这些基本函数。上面的服务器使用的是迭代模式的,即只有处理完一个客户端请求才会去处理下一个客户端的请求,这样的服务器处理能力是很弱的,现实中的服务器都需要有并发处理能力!为了需要并发处理,服务器需要fork()一个新的进程或者线程去处理请求等。

7、动动手

留下一个问题,欢迎大家回帖回答!!!是否熟悉Linux下网络编程?如熟悉,编写如下程序完成如下功能:

服务器端:

接收地址192.168.100.2的客户端信息,如信息为“Client Query”,则打印“Receive Query”

客户端:

向地址192.168.100.168的服务器端顺序发送信息“Client Query test”,“Cleint Query”,“Client Query Quit”,然后退出。

题目中出现的ip地址可以根据实际情况定。

——本文只是介绍了简单的socket编程。

更为复杂的需要自己继续深入。

(unix
domain socket)使用udp发送>=128K的消息会报ENOBUFS的错误(一个实际socket编程中遇到的问题,希望对你有帮助)



作者:吴秦

出处:http://www.cnblogs.com/skynet/

Linux下Socket编程
什么是Socket

Socket接口是TCP/IP网络的API,Socket接口定义了许多函数或例程,程式员能够用他们来研发TCP/IP网络上的应用程式。要学Internet上的TCP/IP网络编程,必须理解Socket接口。

Socket接口设计者最先是将接口放在Unix操作系统里面的。假如了解Unix系统的输入和输出的话,就很容易了解Socket了。网络的 Socket数据传输是一种特别的I/O,Socket也是一种文档描述符。Socket也具备一个类似于打开文档的函数调用Socket(),该函数返回一个整型的Socket描述符,随后的连接建立、数据传输等操作都是通过该Socket实现的。常用的Socket类型有两种:流式Socket (SOCK_STREAM)和数据报式Socket(SOCK_DGRAM)。流式是一种面向连接的Socket,针对于面向连接的TCP服务应用;数据报式Socket是一种无连接的Socket,对应于无连接的UDP服务应用。

Socket建立

  为了建立Socket,程式能够调用Socket函数,该函数返回一个类似于文档描述符的句柄。socket函数原型为:

int socket(int domain, int type, int protocol);

domain指明所使用的协议族,通常为PF_INET,表示互连网协议族(TCP/IP协议族);type参数指定socket的类型:SOCK_STREAM 或SOCK_DGRAM,Socket接口还定义了原始Socket(SOCK_RAW),允许程式使用低层协议;protocol通常赋值"0"。 Socket()调用返回一个整型socket描述符,您能够在后面的调用使用他。

Socket描述符是个指向内部数据结构的指针,他指向描述符表入口。调用Socket函数时,socket执行体将建立一个Socket,实际上"建立一个Socket"意味着为一个Socket数据结构分配存储空间。Socket执行体为您管理描述符表。

  两个网络程式之间的一个网络连接包括五种信息:通信协议、本地协议地址、本地主机端口、远端主机地址和远端协议端口。Socket数据结构中包含这五种信息。

Socket配置

通过socket调用返回一个socket描述符后,在使用socket进行网络传输以前,必须配置该socket。面向连接的socket客户端通过调用Connect函数在socket数据结构中保存本地和远端信息。无连接socket的客户端和服务端连同面向连接socket的服务端通过调用 bind函数来配置本地信息。

Bind函数将socket和本机上的一个端口相关联,随后您就能够在该端口监听服务请求。Bind函数原型为:

int bind(int sockfd,struct sockaddr *my_addr, int addrlen);

Sockfd是调用socket函数返回的socket描述符,my_addr是个指向包含有本机IP地址及端口号等信息的sockaddr类型的指针;addrlen常被配置为sizeof(struct
sockaddr)。

struct sockaddr结构类型是用来保存socket信息的:

struct sockaddr {

unsigned short sa_family; /* 地址族, AF_xxx */

char sa_data[14]; /* 14 字节的协议地址 */

};

sa_family一般为AF_INET,代表Internet(TCP/IP)地址族;sa_data则包含该socket的IP地址和端口号。

另外更有一种结构类型:

struct sockaddr_in {

short int sin_family; /* 地址族 */

unsigned short int sin_port; /* 端口号 */

struct in_addr sin_addr; /* IP地址 */

unsigned char sin_zero[8]; /* 填充0 以保持和struct
sockaddr同样大小 */

};

这个结构更方便使用。sin_zero用来将sockaddr_in结构填充到和struct
sockaddr同样的长度,能够用bzero()或memset()函数将其置为零。指向sockaddr_in 的指针和指向sockaddr的指针能够相互转换,这意味着假如一个函数所需参数类型是sockaddr时,您能够在函数调用的时候将一个指向 sockaddr_in的指针转换为指向sockaddr的指针;或相反。

  使用bind函数时,能够用下面的赋值实现自动获得本机IP地址和随机获取一个没有被占用的端口号:

my_addr.sin_port = 0; /* 系统随机选择一个未被使用的端口号 */

my_addr.sin_addr.s_addr = INADDR_ANY; /* 填入本机IP地址 */

通过将my_addr.sin_port置为0,函数会自动为您选择一个未占用的端口来使用。同样,通过将my_addr.sin_addr.s_addr置为INADDR_ANY,系统会自动填入本机IP地址。

注意在使用bind函数是需要将sin_port和sin_addr转换成为网络字节优先顺序;而sin_addr则无需转换。

  电脑数据存储有两种字节优先顺序:高位字节优先和低位字节优先。Internet上数据以高位字节优先顺序在网络上传输,所以对于在内部是以低位字节优先方式存储数据的机器,在Internet上传输数据时就需要进行转换,否则就会出现数据不一致。

下面是几个字节顺序转换函数:

·htonl():把32位值从主机字节序转换成网络字节序

·htons():把16位值从主机字节序转换成网络字节序

·ntohl():把32位值从网络字节序转换成主机字节序

·ntohs():把16位值从网络字节序转换成主机字节序

Bind()函数在成功被调用时返回0;出现错误时返回"-1"并将errno置为相应的错误号。需要注意的是,在调用bind函数时一般不要将端口号置为小于1024的值,因为1到1024是保留端口号,您能够选择大于1024中的任何一个没有被占用的端口号。

连接建立

  面向连接的客户程式使用Connect函数来配置socket并和远端服务器建立一个TCP连接,其函数原型为:

int connect(int sockfd, struct sockaddr *serv_addr,int addrlen);

Sockfd 是socket函数返回的socket描述符;serv_addr是包含远端主机IP地址和端口号的指针;addrlen是远端地质结构的长度。 Connect函数在出现错误时返回-1,并且配置errno为相应的错误码。进行客户端程式设计无须调用bind(),因为这种情况下只需知道目的机器的IP地址,而客户通过哪个端口和服务器建立连接并无需关心,socket执行体为您的程式自动选择一个未被占用的端口,并通知您的程式数据什么时候到打断口。

Connect函数启动和远端主机的直接连接。只有面向连接的客户程式使用socket时才需要将此socket和远端主机相连。无连接协议从不建立直接连接。面向连接的服务器也从不启动一个连接,他只是被动的在协议端口监听客户的请求。

Listen函数使socket处于被动的监听模式,并为该socket建立一个输入数据队列,将到达的服务请求保存在此队列中,直到程式处理他们。

int listen(int sockfd, int backlog);

Sockfd 是Socket系统调用返回的socket 描述符;backlog指定在请求队列中允许的最大请求数,进入的连接请求将在队列中等待accept()他们(参考下文)。Backlog对队列中等待服务的请求的数目进行了限制,大多数系统缺省值为20。假如一个服务请求到来时,输入队列已满,该socket将拒绝连接请求,客户将收到一个出错信息。

当出现错误时listen函数返回-1,并置相应的errno错误码。

accept()函数让服务器接收客户的连接请求。在建立好输入队列后,服务器就调用accept函数,然后睡眠并等待客户的连接请求。

int accept(int sockfd, void *addr, int *addrlen);

sockfd是被监听的socket描述符,addr通常是个指向sockaddr_in变量的指针,该变量用来存放提出连接请求服务的主机的信息(某台主机从某个端口发出该请求);addrten通常为一个指向值为sizeof(struct
sockaddr_in)的整型指针变量。出现错误时accept函数返回-1并置相应的errno值。

  首先,当accept函数监控的 socket收到连接请求时,socket执行体将建立一个新的socket,执行体将这个新socket和请求连接进程的地址联系起来,收到服务请求的初始socket仍能够继续在以前的 socket上监听,同时能够在新的socket描述符上进行数据传输操作。

数据传输

Send()和recv()这两个函数用于面向连接的socket上进行数据传输。

Send()函数原型为:

int send(int sockfd, const void *msg, int len, int flags);

Sockfd是您想用来传输数据的socket描述符;msg是个指向要发送数据的指针;Len是以字节为单位的数据的长度;flags一般情况下置为0(关于该参数的用法可参照man手册)。

Send()函数返回实际上发送出的字节数,可能会少于您希望发送的数据。在程式中应该将send()的返回值和欲发送的字节数进行比较。当send()返回值和len不匹配时,应该对这种情况进行处理。

char *msg = "Hello!";

int len, bytes_sent;

……

len = strlen(msg);

bytes_sent = send(sockfd, msg,len,0);

……

recv()函数原型为:

int recv(int sockfd,void *buf,int len,unsigned int flags);

Sockfd是接受数据的socket描述符;buf 是存放接收数据的缓冲区;len是缓冲的长度。Flags也被置为0。Recv()返回实际上接收的字节数,当出现错误时,返回-1并置相应的errno值。

Sendto()和recvfrom()用于在无连接的数据报socket方式下进行数据传输。由于本地socket并没有和远端机器建立连接,所以在发送数据时应指明目的地址。

sendto()函数原型为:

int sendto(int sockfd, const void *msg,int len,unsigned int flags,const struct sockaddr *to, int tolen);

  该函数比send()函数多了两个参数,to表示目地机的IP地址和端口号信息,而tolen常常被赋值为sizeof
(struct sockaddr)。Sendto 函数也返回实际发送的数据字节长度或在出现发送错误时返回-1。

Recvfrom()函数原型为:

int recvfrom(int sockfd,void *buf,int len,unsigned int flags,struct sockaddr *from,int *fromlen);

from是个struct sockaddr类型的变量,该变量保存源机的IP地址及端口号。fromlen常置为sizeof
(struct sockaddr)。当recvfrom()返回时,fromlen包含实际存入from中的数据字节数。Recvfrom()函数返回接收到的字节数或当出现错误时返回-1,并置相应的errno。

假如您对数据报socket调用了connect()函数时,您也能够利用send()和recv()进行数据传输,但该socket仍然是数据报socket,并且利用传输层的UDP服务。但在发送或接收数据报时,内核会自动为之加上目地和源地址信息。

结束传输

  当任何的数据操作结束以后,您能够调用close()函数来释放该socket,从而停止在该socket上的任何数据操作:

close(sockfd);

  您也能够调用shutdown()函数来关闭该socket。该函数允许您只停止在某个方向上的数据传输,而一个方向上的数据传输继续进行。如您能够关闭某socket的写操作而允许继续在该socket上接受数据,直至读入任何数据。

int shutdown(int sockfd,int how);

Sockfd是需要关闭的socket的描述符。参数 how允许为shutdown操作选择以下几种方式:

·0-------不允许继续接收数据

·1-------不允许继续发送数据

·2-------不允许继续发送和接收数据,

·均为允许则调用close ()

shutdown在操作成功时返回0,在出现错误时返回-1并置相应errno。

Socket编程实例

代码实例中的服务器通过socket连接向客户端发送字符串"Hello,
you are connected!"。只要在服务器上运行该服务器软件,在客户端运行客户软件,客户端就会收到该字符串。

该服务器软件代码如下:

#include

#include

#include

#include

#include

#include

#include

#include

#define SERVPORT 3333 /*服务器监听端口号 */

#define BACKLOG 10 /* 最大同时连接请求数 */

main()

{

int sockfd,client_fd; /*sock_fd:监听socket;client_fd:数据传输socket
*/

struct sockaddr_in my_addr; /* 本机地址信息 */

struct sockaddr_in remote_addr; /* 客户端地址信息 */

if ((sockfd = socket(AF_INET, SOCK_STREAM, 0)) == -1) {

perror("socket创建出错!"); exit(1);

}

my_addr.sin_family=AF_INET;

my_addr.sin_port=htons(SERVPORT);

my_addr.sin_addr.s_addr = INADDR_ANY;

bzero(&(my_addr.sin_zero),8);

if (bind(sockfd, (struct sockaddr *)&my_addr, sizeof(struct sockaddr)) == -1) {

perror("bind出错!");

exit(1);

}

if (listen(sockfd, BACKLOG) == -1) {

perror("listen出错!");

exit(1);

}

while(1) {

sin_size = sizeof(struct sockaddr_in);

if ((client_fd = accept(sockfd, (struct sockaddr *)&remote_addr, &sin_size)) == -1) {

perror("accept出错");

continue;

}

printf("received a connection from %s\n", inet_ntoa(remote_addr.sin_addr));

if (!fork()) { /* 子进程代码段 */

if (send(client_fd, "Hello, you are connected!\n", 26, 0) == -1)

perror("send出错!");

close(client_fd);

exit(0);

}

close(client_fd);

}

}

}

服务器的工作流程是这样的:首先调用socket函数创建一个Socket,然后调用bind函数将其和本机地址连同一个本地端口号绑定,然后调用 listen在相应的socket上监听,当accpet接收到一个连接服务请求时,将生成一个新的socket。服务器显示该客户机的IP地址,并通过新的socket向客户端发送字符串"Hello,you
are connected!"。最后关闭该socket。

  代码实例中的fork()函数生成一个子进程来处理数据传输部分,fork()语句对于子进程返回的值为0。所以包含fork函数的if语句是子进程代码部分,他和if语句后面的父进程代码部分是并发执行的。

客户端程式代码如下:

#include

#include

#include

#include

#include

#include

#include

#include

#define SERVPORT 3333

#define MAXDATASIZE 100 /*每次最大数据传输量 */

main(int argc, char *argv[]){

int sockfd, recvbytes;

char buf[MAXDATASIZE];

struct hostent *host;

struct sockaddr_in serv_addr;

if (argc h_addr);

bzero(&(serv_addr.sin_zero),8);

if (connect(sockfd, (struct sockaddr *)&serv_addr, \

sizeof(struct sockaddr)) == -1) {

perror("connect出错!");

exit(1);

}

if ((recvbytes=recv(sockfd, buf, MAXDATASIZE, 0)) ==-1) {

perror("recv出错!");

exit(1);

}

buf[recvbytes] = '\0';

printf("Received: %s",buf);

close(sockfd);

}

  客户端程式首先通过服务器域名获得服务器的IP地址,然后创建一个socket,调用connect函数和服务器建立连接,连接成功之后接收从服务器发送过来的数据,最后关闭socket。

  函数gethostbyname()是完成域名转换的。由于IP地址难以记忆和读写,所以为了方便,人们常常用域名来表示主机,这就需要进行域名和IP地址的转换。函数原型为:

struct hostent *gethostbyname(const char *name);

函数返回为hosten的结构类型,他的定义如下:

struct hostent {

char *h_name; /* 主机的官方域名 */

char **h_aliases; /* 一个以NULL结尾的主机别名数组 */

int h_addrtype; /* 返回的地址类型,在Internet环境下为AF-INET
*/

int h_length; /* 地址的字节长度 */

char **h_addr_list; /* 一个以0结尾的数组,包含该主机的任何地址*/

};

#define h_addr h_addr_list[0] /*在h-addr-list中的第一个地址*/

当 gethostname()调用成功时,返回指向struct hosten的指针,当调用失败时返回-1。当调用gethostbyname时,您不能使用perror()函数来输出错误信息,而应该使用herror()函数来输出。

  无连接的客户/服务器程式的在原理上和连接的客户/服务器是相同的,两者的区别在于无连接的客户/服务器中的客户一般无需建立连接,而且在发送接收数据时,需要指定远端机的地址。

阻塞和非阻塞

阻塞函数在完成其指定的任务以前不允许程式调用另一个函数。例如,程式执行一个读数据的函数调用时,在此函数完成读操作以前将不会执行下一程式语句。当服务器运行到accept语句时,而没有客户连接服务请求到来,服务器就会停止在accept语句上等待连接服务请求的到来。这种情况称为阻塞(blocking)。而非阻塞操作则能够立即完成。比如,假如您希望服务器仅仅注意检查是否有客户在等待连接,有就接受连接,否则就继续做其他事情,则能够通过将Socket配置为非阻塞方式来实现。非阻塞socket在没有客户在等待时就使accept调用立即返回。

#include

#include

……

sockfd = socket(AF_INET,SOCK_STREAM,0);

fcntl(sockfd,F_SETFL,O_NONBLOCK);

……

通过配置socket为非阻塞方式,能够实现"轮询"若干Socket。当企图从一个没有数据等待处理的非阻塞Socket读入数据时,函数将立即返回,返回值为-1,并置errno值为EWOULDBLOCK。但是这种"轮询"会使CPU处于忙等待方式,从而降低性能,浪费系统资源。而调用 select()会有效地解决这个问题,他允许您把进程本身挂起来,而同时使系统内核监听所需要的一组文档描述符的任何活动,只要确认在任何被监控的文档描述符上出现活动,select()调用将返回指示该文档描述符已准备好的信息,从而实现了为进程选出随机的变化,而不必由进程本身对输入进行测试而浪费CPU开销。Select函数原型为:

int select(int numfds,fd_set *readfds,fd_set *writefds,

fd_set *exceptfds,struct timeval *timeout);

其中readfds、writefds、exceptfds分别是被select()监控的读、写和异常处理的文档描述符集合。假如您希望确定是否能够从标准输入和某个socket描述符读取数据,您只需要将标准输入的文档描述符0和相应的sockdtfd加入到readfds集合中;numfds的值是需要检查的号码最高的文档描述符加1,这个例子中numfds的值应为sockfd+1;当select返回时,readfds将被修改,指示某个文档描述符已准备被读取,您能够通过FD_ISSSET()来测试。为了实现fd_set中对应的文档描述符的配置、复位和测试,他提供了一组宏:

FD_ZERO(fd_set *set)----清除一个文档描述符集;

FD_SET(int fd,fd_set *set)----将一个文档描述符加入文档描述符集中;

FD_CLR(int fd,fd_set *set)----将一个文档描述符从文档描述符集中清除;

FD_ISSET(int fd,fd_set *set)----试判断是否文档描述符被置位。

Timeout参数是个指向struct timeval类型的指针,他能够使select()在等待timeout长时间后没有文档描述符准备好即返回。struct
timeval数据结构为:

struct timeval {

int tv_sec; /* seconds */

int tv_usec; /* microseconds */

};

POP3客户端实例

  下面的代码实例基于POP3的客户协议,和邮件服务器连接并取回指定用户帐号的邮件。和邮件服务器交互的命令存储在字符串数组POPMessage中,程式通过一个do-while循环依次发送这些命令。

#include

#include

#include

#include

#include

#include

#include

#include

#define POP3SERVPORT 110

#define MAXDATASIZE 4096

main(int argc, char *argv[]){

int sockfd;

struct hostent *host;

struct sockaddr_in serv_addr;

char *POPMessage[]={

"USER userid\r\n",

"PASS password\r\n",

"STAT\r\n",

"LIST\r\n",

"RETR 1\r\n",

"DELE 1\r\n",

"QUIT\r\n",

NULL

};

int iLength;

int iMsg=0;

int iEnd=0;

char buf[MAXDATASIZE];

if((host=gethostbyname("your.server"))==NULL) {

perror("gethostbyname error");

exit(1);

}

if ((sockfd = socket(AF_INET, SOCK_STREAM, 0)) == -1){

perror("socket error");

exit(1);

}

serv_addr.sin_family=AF_INET;

serv_addr.sin_port=htons(POP3SERVPORT);

serv_addr.sin_addr = *((struct in_addr *)host->h_addr);

bzero(&(serv_addr.sin_zero),8);

if (connect(sockfd, (struct sockaddr *)&serv_addr,sizeof(struct sockaddr))==-1){

perror("connect error");

exit(1);

}

do {

send(sockfd,POPMessage[iMsg],strlen(POPMessage[iMsg]),0);

printf("have sent: %s",POPMessage[iMsg]);

iLength=recv(sockfd,buf+iEnd,sizeof(buf)-iEnd,0);

iEnd+=iLength;

buf[iEnd]='\0';

printf("received: %s,%d\n",buf,iMsg);

iMsg++;

} while (POPMessage[iMsg]);

close(sockfd);

}

Unix/Linux环境下的Socket编程

网络的Socket数据传输是一种特别的I/O,Socket也是一种文档描述符。 Socket也具备一个类似于打开文档的函数调用Socket(),该函数返回一个整型的Socket描述符,随后的连接建立、数据传输等操作都是通过该 Socket实现的。常用的Socket类型有两种:流式Socket (SOCK_STREAM)和数据报式Socket(SOCK_DGRAM)。流式是一种面向连接的Socket,针对于面向连接的TCP服务应用;数据报式Socket是一种无连接的Socket,对应于无连接的UDP服务应用。

Socket描述符是个指向内部数据结构的指针,他指向描述符表入口。调用Socket函数时,socket执行体将建立一个Socket,实际上"建立一个Socket"意味着为一个Socket数据结构分配存储空间。Socket执行体为您管理描述符表。两个网络程式之间的一个网络连接包括五种信息:通信协议、本地协议地址、本地主机端口、远端主机地址和远端协议端口。Socket数据结构中包含这五种信息。

struct sockaddr结构类型是用来保存socket信息的:

struct sockaddr {

unsigned short sa_family; /* 地址族, AF_xxx */

char sa_data[14]; /* 14 字节的协议地址 */

};

sa_family一般为AF_INET,代表Internet(TCP/IP)地址族;sa_data则包含该socket的IP地址和

端口号。

另外更有一种结构类型:

struct sockaddr_in {

short int sin_family; /* 地址族 */

unsigned short int sin_port; /* 端口号 */

struct in_addr sin_addr; /* IP地址 */

unsigned char sin_zero[8]; /* 填充0 以保持和struct sockaddr同样大小 */

};

能够用bzero()或memset()函数将其置为零。指向sockaddr_in 的指针和指向sockaddr的指针能够相

互转换,这意味着假如一个函数所需参数类型是sockaddr时,您能够在函数调用的时候将一个指向

sockaddr_in的指针转换为指向sockaddr的指针;或相反。

在使用bind函数是需要将sin_port和sin_addr转换成为网络字节优先顺序;而sin_addr则无需转换。

电脑数据存储有两种字节优先顺序:高位字节优先和低位字节优先。Internet上数据以高位字节

优先顺序在网络上传输,所以对于在内部是以低位字节优先方式存储数据的机器,在Internet上传输数

据时就需要进行转换,否则就会出现数据不一致。

  下面是几个字节顺序转换函数:

·htonl():把32位值从主机字节序转换成网络字节序

·htons():把16位值从主机字节序转换成网络字节序

·ntohl():把32位值从网络字节序转换成主机字节序

·ntohs():把16位值从网络字节序转换成主机字节序

Bind()函数在成功被调用时返回0;出现错误时返回"-1"并将errno置为相应的错误号。需要注意的

是,在调用bind函数时一般不要将端口号置为小于1024的值,因为1到1024是保留端口号,您能够选择

大于1024中的任何一个没有被占用的端口号。

连接建立

  面向连接的客户程式使用Connect函数来配置socket并和远端服务器建立一个TCP连接,其函数原型为:int
connect(int sockfd, struct sockaddr *serv_addr,int addrlen); Sockfd是socket函数返回的socket描述符;serv_addr是包含远端主机IP地址和端口号的指针;addrlen是远端地址结构的长度。Connect函数在出现错误时返回-1,并且配置errno为相应的错误码。进行客户端程式设计无须调用bind(),因为这种情况下只需知道目的机器的IP地址,而客户通过哪个端口和服务器建立连接并无需关心,socket执行体为您的程式自动选择一个未被占用的端口,并通知您的程式数据什么时候到打断口。Connect 函数启动和远端主机的直接连接。只有面向连接的客户程式使用socket时才需要将此socket和远端主机相连。无连接协议从不建立直接连接。面向连接的务器也从不启动一个连接,他只是被动的在协议端口监听客户的请求。

Listen函数使socket处于被动的监听模式,并为该socket建立一个输入数据队列,将到达的服务请求

保存在此队列中,直到程式处理他们。 int listen(int sockfd, int backlog); Sockfd 是Socket系统调用返回的socket 描述符;backlog指定在请求队列中允许的最大请求数,进入的连接请求将在队列中等待accept()他们(参考下文)。Backlog对队列中等待服务的请求的数目进行了限制,大多数系统缺省值为20。假如一个服务请求到来时,输入队列已满,该 socket将拒绝连接请求,客户将收到一个出错信息。当出现错误时listen函数返回-1,并置相应的errno错误码。

accept()函数让服务器接收客户的连接请求。在建立好输入队列后,服务器就调用accept函数,然后

睡眠并等待客户的连接请求。int accept(int sockfd, void *addr, int *addrlen); sockfd是被监听的socket描述符,addr通常是个指向sockaddr_in变量的指针,该变量用来存放提出连接请求服务的主机的信息(某台主机从某个端口发出该请求);addrlen通常为一个指向值为sizeof(struct
sockaddr_in)的整型指针变量。出现错误时accept函数返回-1并置相应的errno值。当accept函数监控的socket收到连接请求时,socket执行体将建立一个新的socket,执行体将这个新socket和请求连接进程的地址联系起来,收到服务请求的初始socket仍能够继续在以前的 socket上监听,同时能够在新的socket描述符上进行数据传输操作。

数据传输

(面向连接TCP)

send()和recv()这两个函数用于面向连接的socket上进行数据传输。Send()函数原型为:

int send(int sockfd, const void *msg, int len, int flags); Sockfd是您想用来传输数据的socket描述符;msg是个指向要发送数据的指针;Len是以字节为单位的数据的长度;flags一般情况下置为0。Send()函数返回实际上发送出的字节数,可能会少于您希望发送的数据。在程式中应该将send()的返回值和欲发送的字节数进行比较。当send()返回值和len不匹配时,应该对这种情况进行处理。

int recv(int sockfd,void *buf,int len,unsigned int flags); Sockfd是接受数据的socket描述符;buf 是存放接收数据的缓冲区;len是缓冲的长度。Flags也被置为0。Recv()返回实际上接收的字节数,当出现错误时,返回-1并置相应的errno值。

(无连接UDP)

sendto()和recvfrom()用于在无连接的数据报socket方式下进行数据传输。由于本地socket并没有和远端机器建立连接,所以在发送数据时应指明目的地址。

int sendto(int sockfd, const void *msg,int len,unsigned int flags,const struct sockaddr *to, int tolen);该函数比send()函数多了两个参数,to表示目地机的IP地址和端口号信息,而tolen常常被赋值为sizeof
(struct sockaddr)。sendto函数也返回实际发送的数据字节长度或在出现发送错误时返回-1。

int recvfrom(int sockfd,void *buf,int len,unsigned int flags,struct sockaddr *from,int *fromlen); from是个struct sockaddr类型的变量,该变量保存源机的IP地址及端口号。fromlen常置为sizeof
(struct sockaddr)。当recvfrom()返回时,fromlen包含实际存入from中的数据字节数。

Recvfrom()函数返回接收到的字节数或当出现错误时返回-1,并置相应的errno。

结束传输

当任何的数据操作结束以后,您能够调用close()函数来释放该socket,从而停止在该socket上的任

何数据操作:close(sockfd); 也能够调用shutdown()函数来关闭该socket。该函数允许您只停止在某个方向上的数据传输,而一个方向上的数据传输继续进行。如您能够关闭某socket的写操作而允许继续在该socket上接受数据,直至读入任何数据。Sockfd 是需要关闭的socket的描述符。参数 how允许为shutdown操作选择以下几种方式:0-------不允许继续接收数据 1-------不允许继续发送数据 2-------不允许继续发送和接收数据,均为允许则调用close
() shutdown在操作成功时返回0,在出现错误时返回-1并置相应errno。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: