您的位置:首页 > 其它

编写简单多线程web服务器

2008-09-12 15:05 281 查看
编写简单多线程web服务器


刺猬@http://blog.csdn.net/littlehedgehog

下面的原理解释参照《一个多线程web服务器实例(C,Linux,详细的web服务器原理)》 一文:

原理:
在浏览器中输入一个网址,回车之后,浏览器会向相应主机的相应端口发送一段报文,如果是http协议的(如平常看到的网页的传输协议),就会发送HTTP请求报文。下面是一个报文的例子:

GET /index.html HTTP/1.1
Host: 127.0.0.1:8848
User-Agent: Mozilla/5.0 (X11; U; Linux i686; zh-CN; rv:1.8.0.1) Gecko/20060313 Fedora/1.5.0.1-9 Firefox/1.5.0.1 pango-text
Accept: text/xml,application/xml,application/xhtml+xml,text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5
Accept-Language: zh-cn,zh;q=0.5
Accept-Encoding: gzip,deflate
Accept-Charset: gb2312,utf-8;q=0.7,*;q=0.7
Keep-Alive: 300
Connection: keep-alive


我们在服务器端把收到的数据打印出来,可以看到浏览器发过来的就是这个东西。当然,也可以用ethereal等抓包工具来抓获这些报文。关于报文里写的是什么意思,网上有很多资料的,GOOGLE一下就有了。我们只看第一行。

GET表示是要从服务器获取文件,/index.html是文件的路
径,这个路径是相对于服务器端程序所在文件夹的路径。如我的服务器端程序放在/home/mio/program/webserver1707/里面,那
这个index.html在服务器上的绝对路径就是/home/mio/program/webserver1707/index.html。如果报文里
是GET /admin/login.html
HTTP/1.1的话,那么login.html文件在服务器端的路径是/home/mio/program/webserver1707/admin
/login.html.HTTP/1.1表示的是HTTP协议的版本是1.1.

服务器端程序运行后,一直监听12345端品(0-1023的端口由
IANA统一分配和控制的,不要用,最好选大一些的端口号。我原来用了个1234,用不了,还是选大一点好,可以用5460之类的啊~:)
),当监听到客户端发来的请求后,就与客户端建立链接,接收客户端发过来的请求报文。我们如果把这些报文打出来,就可以看到就是与上面请求报文类似的东西
了。

下面我们要根据所接受的到的请求报文(GET /index.html HTTP/1.1)
来决定放给客户端(即浏览器)什么东西。这里我们看到浏览器要的是index.html这样一个html文本,我们就在相应路径(/home/mio
/program/webserver1707/index.html)找到这个文件,不过不要急着发给客户端,我们要先告诉客户端,发过去的是一个
html文件,让浏览器做好相应的准备。怎么让浏览器知道呢?我们还是用报文,这个报文叫响应报文。报文由状态行、首部行、实体主体三部分组成。状态行只
有一行,它和首部行、首部行的每行之间是没有空行的,但是首部行与实体主体之间有一个空行,表明从这个空行开始,就是你浏览器要的数据了。
下面是一个用
ethereal抓到的响应报文:

HTTP/1.1 200 OK
Cache-Control: private
Content-Type: text/html; charset=UTF-8
Content-Encoding: gzip
Server: GWS/2.1
Content-Length: 1851
Date: Sat, 14 Oct 2006 11:33:39 GMT

<html><head><meta
http-equiv="content-type" content="text/html;
charset=UTF-8"><title>Google</title><style><!--
body,td,a,p,.h{font-family:arial,sans-serif}
.h{font-size:20px}
.q{color:#00c}
--></style>
<script>
<!--
function sf(){document.f.q.focus();}
function
clk(url,oi,cad,ct,cd,sg){if(document.images){var e =
window.encodeURIComponent ? encodeURIComponent : escape;var u="";var
oi_param="";var cad_param="";if (url)
u="&url="+e(url.replace(/#.*/,"")).replace(//+/g,"%2B");if (oi)
oi_param="&oi="+e(oi);if (cad) cad_param="&cad="+e(cad);new
Image().src="/url?sa=T"+oi_param+cad_param+"&ct="+e(ct)+"&cd="+e(cd)+u+"&ei=E8swRYIOkpKwAvzZ8JkB"+sg;}return
true;}
// -->
</script>
</head><body
bgcolor=#ffffff text=#000000 link=#0000cc vlink=#551a8b alink=#ff0000
onLoad=sf() topmargin=3 marginheight=3><center><div
align=right nowrap style="padding-bottom:4px" width=100%><font
size=-1><b>manioster@gmail.com</b> | <a
href="/url?sa=p&pref=ig&pval=3&q=http://www.google.com/ig%3Fhl%3Dzh-CN&sig=__1eXNMn0jGllmJ57x74DzjVvy6Vk="
onmousedown="return
clk('/url?sa=p&pref=ig&pval=3&q=http://www.google.com
/ig%3Fhl%3Dzh-
CN&sig=__1eXNMn0jGllmJ57x74DzjVvy6Vk=','promos','hppphou:zh-
cn_all','pro','1','&sig2=zclmOmtQiZPPuTCMWUJMZA')">个性化主页</a&
gt; | <a href="https://www.google.com/accounts/ManageAccount">我的帐户</a> | <a href="http://www.google.com/accounts/Logout?continue=http://www.google.com/intl/zh-CN/">
退出</a></font></div><img
src="/intl/zh-CN_ALL/images/logo.gif" width=286 height=110
alt="Google"><br><br>
<form action=/search name=f><script><!--
function
qs(el) {if (window.RegExp && window.encodeURIComponent) {var
ue=el.href;var
qe=encodeURIComponent(document.f.q.value);if(ue.indexOf("q=")!=-1){el.href=ue.replace(new
RegExp("q=[^&$]*"),"q="+qe);}else{el.href=ue+"&q="+qe;}}return
1;}
// -->
..........

第一个空行上面的就是“说明”了,下面是html代码。有了说明,浏
览器就知道这是什么了,拿到这段数据后,就把这些html标签解释成各种各样的元素,在浏览器上有序地显示出来。浏览器还蛮聪明的,当看到<img
src=..>标签,那就会又自己发一个请求报文给服务器,要求得到一个图像文件,请求报文就像:

GET /image/pp.jpg HTTP/1.1
....

这样,服务器端就找到这个.jpg图像,加上"说明"之后发给浏览器,浏览器收到后就显示在对应的位置上。遇到包含css、js...的标签也一样。

如此重复,一个完整的web就会呈现在我们眼前了。

这里是服务器源码,本来打算可以传完整http网页的,包括图片。不过图片传输一直有问题。暂时放一放了。

#include <stdio.h>
#include <string.h>
#include <fcntl.h>
#include <pthread.h>
#include <sys/socket.h>
#include <netdb.h>
#include <netinet/in.h>

#define HOSTLEN 256
#define PORTNUM 12345

//#define DEBUG

int make_server_socket_q(int,int);

void error(char *err)
{
fprintf(stderr,"error detected %s :",err);
perror("");
exit(1);
}

int make_server_socket(int port) //num for listen
{
return make_server_socket_q(port,1);
}

int make_server_socket_q(int port,int backlog)
{
struct sockaddr_in saddr_in;
struct hostent *hp; /*惠普*/
char hostname[HOSTLEN];
int sock_id;

/* 获取一个socket*/
sock_id=socket(PF_INET,SOCK_STREAM,0);

if(sock_id==-1)
error("socket failed");

memset((void *)&saddr_in,0,sizeof(saddr_in));

gethostname(hostname,HOSTLEN);
hp=gethostbyname(hostname);

bcopy(hp->h_addr,(void *)&saddr_in.sin_addr,hp->h_length);
saddr_in.sin_port=htons(port);
saddr_in.sin_family=hp->h_addrtype;

/* 绑定 */
if(bind(sock_id,(struct sockaddr *)&saddr_in,sizeof(struct sockaddr_in))==-1)
{
close(sock_id);
error("bind failed");
}

/* 允许接入*/
if(listen(sock_id,3))
error("listen failed");

return sock_id;

}

/* 测试是否存在 */
int check_exist(char *filename)
{
FILE *fp;
if((fp=fopen(filename,"r"))==NULL)
return 0;
fclose(fp);
return 1;
}

/* 检测文件类型 */
char * file_type(char *filename)
{
char *p=filename;
char *ext=filename+strlen(filename);
while(ext>p&&*ext!='.')
ext--;
if(ext>p)
return ext+1;
return NULL;
}

/* 报文 头部 */
void do_head(int sock_fd,char *type)
{
char buffer[64];
sprintf(buffer,"HTTP/1.0 200 OK/r/n");
if(type)
sprintf(buffer+strlen(buffer),"Content-Type:%s/r/n",type);
write(sock_fd,buffer,strlen(buffer));
}

/* 404 文件没找到 */
void do_nofile(char *filename,int sock_fd)
{
FILE *fp=fdopen(sock_fd,"w");

fprintf(fp,"HTTP/1.1 404 Not Found/r/n");
fprintf(fp,"Content-type:text/plain/r/n");
fprintf(fp,"/r/n");
fprintf(fp,"The file you requested: %s is not found/r/n",filename);

fclose(fp);
}

/* 处理其它命令 */
void do_unkown(int sock_fd)
{
FILE *fp=fdopen(sock_fd,"w");
fprintf(fp,"HTTP/1.0 501 Not Implement /r/n");
fprintf(fp,"Content-Type:text/plain/r/n");
fprintf(fp,"/r/n");
fprintf(fp,"That command is not yet implement/r/n");
fclose(fp);
}

/* 核心处理 从文件中读取 然后写入socket */
void do_show(char *arg,int sock_fd)
{
FILE *sock_fp,*file_fp;
char *extension=file_type(arg);
char *content="text/plain";
char buf[BUFSIZ]={0};
char c;
if(!extension)
return ;

if(strcmp(extension,"html")==0)
content="text/html";
else if(strcmp(extension,"htm")==0)
content="text/htm";
else if(strcmp(extension,"gif")==0)
content="image/gif";
else if(strcmp(extension,"jpg")==0)
content="image/jpg";
else if(strcmp(extension,"png")==0)
content="image/png";
else
content="text/plain"; //默认处理

sock_fp=fdopen(sock_fd,"w");
file_fp=fopen(arg,"rb");

if(file_fp!=NULL&&sock_fp!=NULL)
{
do_head(sock_fd,content);
while((fgets(buf,BUFSIZ,file_fp)))
fputs(buf,sock_fp);
fclose(file_fp);
fclose(sock_fp);
}
}

/* request处理 */
int process_rq(char *request,int sock_fd)
{
char cmd[16],arg[BUFSIZ],buf[BUFSIZ];

strcpy(arg,"./");

if(sscanf(request,"%s%s",cmd,buf)!=2)
return -1;

/* 下面是处理文件名 */
if(buf[0]=='.'&&buf[1]=='/')
strcpy(arg,buf);
else if(buf[0]=='/')
strcpy(arg+1,buf);
else
strcpy(arg+2,buf);

/* 目前只能支持get命令 */
if(!(strcmp(cmd,"GET")==0||strcmp(cmd,"get")==0))
do_unkown(sock_fd);
else if(!check_exist(arg))
do_nofile(arg,sock_fd);
else
do_show(arg,sock_fd);

}

/* 线程主函数 */
void thread_routine(void *fd)
{
int sock_fd=*((int *)fd);
char request[BUFSIZ];
FILE *sock_fp=fdopen(sock_fd,"r");
fgets(request,BUFSIZ,sock_fp);
#ifdef DEBUG
printf("a call:request= %s/n",request);
#else
process_rq(request,sock_fd);
#endif
fclose(sock_fp);
}

int main(int argc,char *argv[])
{
int port;
int sock_id;
int sock_fd;

FILE *sock_fp;

pthread_t thread;

if(!(argc==1||argc==2))
{
printf("usage : %s port",argv[0]);
return -1;
}

port=argc==1?PORTNUM:atoi(argv[1]); //注意这里如果只有一个参数,即是设置默认端口

if((sock_id=make_server_socket(port))==-1)
return -1;

printf("now listen to the port #%d/n",port);

fflush(stdout);

while(1)
{
sock_fd=accept(sock_id,NULL,NULL);
sock_fp=fdopen(sock_fd,"r");

pthread_create(&thread,NULL,(void *)thread_routine,(void *)&sock_fd); //开辟线程处理
fclose(sock_fp);
}

return 0;
}
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: