您的位置:首页 > 运维架构 > Apache

apache源码分析入门(一)

2010-04-19 20:24 253 查看
大家好,我是artleaf,也就是培培。从今天开始,我将会进行apache源码的分析。其实之前就很想分析apache源码了,但是一直是自己偷懒,给自己找借口,因为apache源码比较多,大概有28万行吧,很艰巨的工作呀。而且本身我也是一个水平很低的小程序员,深怕自己吃不下来,毕竟apache是开源里面已经相当成熟的软件了,里面的代码的质量是相当的高,是多少牛人经过无数次推敲而出来的,我一个对it技术似懂非懂的人,怎么能弄懂这个软件,而且懂it的人都知道,apache占领着世界60%的服务器市场,这么一个强悍的软件,要想弄懂它不是一件容易的事情,而且也不是一朝一夕的事情。但是总归是要做的,现在不做,以后可能就没有时间做了,所以硬着头皮,开始一点一点的分析吧。所以此贴会不定期更新,因为我没有办法保证自己每一周可以分析出来一些东西,但是我会尽量做好。 看apache 需要你了解C语言的知识,这个是必须的,因为apache是由C语言写出来的,其次是学过数据结构,Linux的知识暂时不必要求太深,本身我的Linux知识很肤浅,但是随着分析的深入,需要再知道什么知识,我们在说。我们首先是要分析apache的内存结构,就是apache的apr库,这个对于上述知识已经够了。我分析的是apache的httpd-2.2.15这个版本,apr库中memory中的apr_pools.c这个程序有2602行。我们首先分析的就是这个程序。为什么要分析这个程序呢?其实很久之前就有一个人在做分析apache的源码了,就是张中庆师兄,张师兄在csdn上有博客叫做tingya的专栏,大家有兴趣的可以去看看,张师兄的技术就比较强悍了,我刚开始看apache的知识的时候,就是通过张师兄的apache分析来看的,但是张师兄水平比较高,所以很多地方都是一笔带过,讲的很精练,像我水平这么低的人,要琢磨半天才能明白张师兄的深意。这里我开始的分析,就没有张师兄那么厉害,我只是为了提升自己对软件开放的理解,也对大型软件的掌握,同时提升下自己的计算机软件编程技术水平才想分析apache这个软件的。在tingya的专栏里面我们可以看到为什么会先分析apr库,下面我选自张师兄的话:对于APR中的所有的对象中,内存池对象应该是其余对象内存分配的基础,不仅是APR中的对象,而且对于整个Apache中的大部分对象的内存都是从内存池中进行分配的,因此我们将把内存池作为整个APR的基础。而apr库是apache的基础,所以我们从apr库开始分析。但是之前我们先分析下main函数,来给apache有个有个整体的认识。 好,首先我们先来看看apache的main()函数。这个是apache的开始, #include "apr.h" #include "apr_strings.h" #include "apr_getopt.h" #include "apr_general.h" #include "apr_lib.h" #include "apr_md5.h" #include "apr_time.h" #include "apr_version.h" #include "apu_version.h" #include "apr_want.h" #include "ap_config.h" #include "httpd.h" #include "http_main.h" #include "http_log.h" #include "http_config.h" #include "http_core.h" #include "http_vhost.h" #include "apr_uri.h" #include "util_ebcdic.h" #include "ap_mpm.h" #include "mpm_common.h" 这些是apache中main函数中声明的21个头文件,我们可以看到这里面第一个是apr库的声明。之后有字符串处理的头文件也有加密的头文件等等。暂时我们先不用管这么多。这里只是先给出一个概念。之后我们看下main()函数的变量的定义, char c; int configtestonly = 0; const char *confname = SERVER_CONFIG_FILE; const char *def_server_root = HTTPD_ROOT; const char *temp_error_log = NULL; const char *error; process_rec *process; server_rec *server_conf; apr_pool_t *pglobal; apr_pool_t *pconf; apr_pool_t *plog; apr_pool_t *ptemp; apr_pool_t *pcommands; apr_getopt_t *opt; apr_status_t rv; module **mod; const char *optarg; APR_OPTIONAL_FN_TYPE(ap_signal_server) *signal_server; 我们可以看到,红色的部分都是从内存池中分配出来的,关于内存池的概念,我们下一次对apr库分析的时候会给出解释。从这些变量我们也可以看出,内存分配也是多么的基础。之后我们来看下main函数里面调用的各个函数。 AP_MONCONTROL(0); process = init_process(&argc, &argv); ap_server_argv0 = process->short_name; apr_pool_create(&pcommands, pglobal); apr_pool_tag(pcommands, "pcommands"); ap_server_pre_read_config = apr_array_make(pcommands, 1, sizeof(char *)); ap_server_post_read_config = apr_array_make(pcommands, 1, sizeof(char *)); ap_server_config_defines = apr_array_make(pcommands, 1, sizeof(char *)); apr_getopt_init(&opt, pcommands, process->argc, process->argv); apr_pool_create(&plog, pglobal); apr_pool_tag(plog, "plog"); apr_pool_create(&ptemp, pconf); apr_pool_tag(ptemp, "ptemp"); apr_pool_destroy(ptemp); ap_fixup_virtual_hosts(pconf, server_conf); ap_fini_vhost_config(pconf, server_conf); apr_hook_sort_all(); apr_pool_clear(plog); apr_pool_destroy(ptemp); apr_pool_lock(pconf, 1); ap_run_optional_fn_retrieve(); apr_pool_lock(pconf, 0); destroy_and_exit_process(process, 0); 这里几乎包含了main函数里面所有的函数的调用,但是还是有一部分,在这里我们先忽略,大家不要被我罗列在这里的这些只知其名,不知其意的函数所吓倒,我们一点一点的分析。我们首先只需要关注apr库中内存池的各个函数。也就是我上面用红色标注的函数。 虽然我们在主函数中屏蔽掉了很多代码,或许是在主程序中非常有用的代码,但是我们先要分析的是apr库里面的内存池部分,所有暂时可以看作是不重要的,等我们把内存池分析完成之后,我们在回过头来看这些代码。等我们把整个apache的数据结构掌握之后,这些代码的分析就会变的非常的简单和快速,而最开始的我们先从最简单的部分开始分析,所有下一次分析中,我们开始着手进行内存池的分析,这个是apr库的基础,也是整个apache的基础。下一次,我将带来对内存池的分析,敬请大家期待。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: