您的位置:首页 > 其它

RRD文件格式分析

2014-03-03 15:25 183 查看
一、 文件格式:rrd 文件格式大体分为两部分:1.文件头信息区:该区域包含一些版本信息和一些于数据存储区相关的一些信息。例如:RRD的版本号,DS数量,DS名称,DS类型,RRA数量,RRA类型,PDP数据区,CDP数据区,最后更新时间,RRA目前更新到的位置等等信息。2.数据存储区:该区域存储了实际的数据。数据的来源是根据在创建RRD文件时DS的类型及相关RRA定义,并通过相关的计算得出的(CF,DST)。注意:数据源(DS)是存储的实体,而RRA是数据存储的载体。在逻辑上,每个RRA都有所有DS的数据(计算)。RRA和DS的关系如下图所示:
RRD文件大体格式如下
数据结构:typedef struct rrd_t {stat_head_t      *stat_head;ds_def_t         *ds_def;rra_def_t        *rra_def;live_head_t      *live_head;pdp_prep_t       *pdp_prep;cdp_prep_t       *cdp_prep;rra_ptr_t        *rra_ptr;rrd_value_t      *rrd_value;} rrd_t;下面分别详细介绍RRD头部区域和RRD数据区域:1.RRD头区域:a)        RRD头区域包括:i.              静态头部:数据结构:typedef struct stat_head_t {char             cookie[4];    //“RRD”char             version[5];    //RRD版本信息double           float_cookie;  //unsigned long    ds_cnt;        //(DS)数据源的个数unsigned long    rra_cnt;        //RRA个数unsigned long    pdp_step;       //数据插入间隔unival           par[10];} stat_head_t;说明:重要的信息要素:ds_cnt-数据源个数:该数据值是在创建RRD文件的时候获取到,作用为标识该RRD文件有多少个DS。rra_cnt-RRA个数:该数据值是在创建RRD文件的时候获取到,作用为标识该RRD文件有多少RRA。pdp_step-间隔时间:期望多长时间接受到数据。该数据值是在创建RRD文件的时候获取到。举例:RRD文件命令如下所示:Rrdtool create first.rrd –start N --step 1  \DS:fir:COUNTER:2:U:U  \DS:sec:GAUGE:2:U:U \RRA:AVERAGE:0.5:1:60 \RRA:MAX:0.5:60:60 \RRA:MIN:0.5:3600:24 \RRA:LAST:0.5: 86400:7 \命令说明:命令的格式请参考相关的RRD文档,这里我们只针对相关上面的数据结构进行解释ds_cnt   = 2;rra_cnt   = 4;pdp_step = 1;ii.              DS定义域:数据结构:typedef struct ds_def_t {char    ds_nam[DS_NAM_SIZE];  //数据源名称char    dst[DST_SIZE];          //数据源类型unival   par[10];} ds_def_t;说明:ds_nam:数据原名称。在创建的时候指定。dst:数据源类型。创建时指定。ds_def [0].ds_nam = firds_def [0].dst    = COUNTERds_def [1].ds_nam = secds_def [1].dst    = GAUGEiii.              RRA定义域:数据结构:typedef struct rra_def_t{char          cf_nam[CF_NAM_SIZE];  //CF(合并类型)unsigned long  row_cnt;                //RRA行数unsigned long  pdp_cnt;                //pdp个数unival        par[MAX_RRA_PAR_EN];} rra_def_t;说明:cf_nam:合并数据的类型。(PDP数据合成CDP数据时的类型)例如:RRA1.Rrdtool create first.rrd –start N --step 1  \DS:fir:COUNTER:2:U:U  \DS:sec:GAUGE:2:U:U \RRA:AVERAGE:0.5:1:60 \RRA:MAX:0.5:60:60 \RRA:MIN:0.5:3600:24 \RRA:LAST:0.5: 86400:7 \将60个,间隔时间为1s的数据(PDP)合成,计算其60个中最大的作为该RRA中的数据源(DS)的计算值进行存储。row_cnt:RRA的行数(每一行有所有数据源的数据)pdp_cnt:该RRA在合并数据时所占用的pdp数量。rra_def_t [0]. cf_nam = AVERAGErra_def_t [0]. row_cnt = 60rra_def_t [0]. pdp_cnt = 1rra_def_t [1]. cf_nam = AVERAGErra_def_t [1]. row_cnt = 60rra_def_t [1]. pdp_cnt = 60rra_def_t [2]. cf_nam = AVERAGErra_def_t [2]. row_cnt = 24rra_def_t [2]. pdp_cnt = 60*60rra_def_t [3]. cf_nam = AVERAGErra_def_t [3]. row_cnt = 7rra_def_t [3]. pdp_cnt = 60*60*24
小节:根据上面的分析,到现在应该清楚了RRD文件中RRA和DS的具体关系了。具体如下:活动头部:数据结构:typedef struct live_head_t {time_t           last_up;  //最后更新时间(秒)long            last_up_usec;     //最后更新毫秒} live_head_t;说明:last_up : RRD文件最后更新的时间(秒级)last_up_usec:RRD文件最后更新时间(微秒级)*仅一条数据ii.              PDP数据域:数据结构:typedef struct pdp_prep_t{char last_ds[LAST_DS_LEN];  //目前更新rrd 文件的数据unival        scratch[10];} pdp_prep_t;说明:unival        scratch[10]:该变量类型是一个结构体,变量的功能就是存储计算CDP,计算多长时间没有接受到数据,等相关的信息.在实际的rrd文件中PDP的数量为DS的数量.存储的是每个DS的相关数据信息(时间,真实数据).iii.              CDP数据域:typedef struct cdp_prep_t{unival         scratch[MAX_CDP_PAR_EN];} cdp_prep_t;说明:scratch:该变量存储了与计算CDP相关的数据,如多少个PDP没有数据(与该RRA中PDP的数量有关),目前CDP数据的计算值等信息.改CDP的数量与RRA的数量相同,同时每一条CDP数据里面包含所有的DS.简单的说就是CDP是RRA的缩小集合,目的是为计算相同RRA中下一条RRA记录做准备.iv.              RRA指针域:typedef struct rra_ptr_t {unsigned long    cur_row; //目前不同RRA数据已经更新到的//位置} rra_ptr_t;小节:到目前位置已经清楚的看到了RRD头文件的大体面貌,至于具体的结构体内部请参考相应的代码.RRD头文件结构图如下(根据上面创建命令绘制)1.RRD数据区:数据结构:typedef    double   rrd_value_t;  //RRD数据类型rrd_value_t      *rrd_value;            //RRD在内存中存储形式说明:RRD文件文件中除了RRD文件头部区域剩下的就是RRD文件数据区域.数据区域可以想象成为n*k*m 的矩阵,n为RRA的数量,k为不同RRA的行数,m为数据源DS的数量.RRD数据区域的图形请参考上面RRA与DS的小节.
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: