您的位置：首页 > 其它

RRD文件格式分析

2014-03-03 15:25 183 查看

一、文件格式：rrd 文件格式大体分为两部分：1．文件头信息区：该区域包含一些版本信息和一些于数据存储区相关的一些信息。例如：RRD的版本号，DS数量，DS名称，DS类型，RRA数量，RRA类型，PDP数据区，CDP数据区，最后更新时间，RRA目前更新到的位置等等信息。2．数据存储区：该区域存储了实际的数据。数据的来源是根据在创建RRD文件时DS的类型及相关RRA定义，并通过相关的计算得出的（CF，DST）。注意：数据源（DS）是存储的实体，而RRA是数据存储的载体。在逻辑上，每个RRA都有所有DS的数据（计算）。RRA和DS的关系如下图所示：

RRD文件大体格式如下

数据结构：typedef struct rrd_t {stat_head_t      *stat_head;ds_def_t         *ds_def;rra_def_t        *rra_def;live_head_t      *live_head;pdp_prep_t       *pdp_prep;cdp_prep_t       *cdp_prep;rra_ptr_t        *rra_ptr;rrd_value_t      *rrd_value;} rrd_t;下面分别详细介绍RRD头部区域和RRD数据区域：1．RRD头区域：a)        RRD头区域包括：i.              静态头部：数据结构：typedef struct stat_head_t {char             cookie[4];    //“RRD”char             version[5];    //RRD版本信息double           float_cookie;  //unsigned long    ds_cnt;        //（DS）数据源的个数unsigned long    rra_cnt;        //RRA个数unsigned long    pdp_step;       //数据插入间隔unival           par[10];} stat_head_t;说明：重要的信息要素：ds_cnt－数据源个数：该数据值是在创建RRD文件的时候获取到，作用为标识该RRD文件有多少个DS。rra_cnt－RRA个数：该数据值是在创建RRD文件的时候获取到，作用为标识该RRD文件有多少RRA。pdp_step－间隔时间：期望多长时间接受到数据。该数据值是在创建RRD文件的时候获取到。举例：RRD文件命令如下所示：Rrdtool create first.rrd –start N --step 1  \DS:fir:COUNTER:2:U:U  \DS:sec:GAUGE:2:U:U \RRA:AVERAGE:0.5:1:60 \RRA:MAX:0.5:60:60 \RRA:MIN:0.5:3600:24 \RRA:LAST:0.5: 86400:7 \命令说明：命令的格式请参考相关的RRD文档，这里我们只针对相关上面的数据结构进行解释ds_cnt   ＝ 2；rra_cnt   ＝ 4；pdp_step ＝ 1；ii.              DS定义域：数据结构：typedef struct ds_def_t {char    ds_nam[DS_NAM_SIZE];  //数据源名称char    dst[DST_SIZE];          //数据源类型unival   par[10];} ds_def_t;说明：ds_nam：数据原名称。在创建的时候指定。dst：数据源类型。创建时指定。ds_def [0].ds_nam = firds_def [0].dst    = COUNTERds_def [1].ds_nam = secds_def [1].dst    = GAUGEiii.              RRA定义域：数据结构：typedef struct rra_def_t{char          cf_nam[CF_NAM_SIZE];  //CF（合并类型）unsigned long  row_cnt;                //RRA行数unsigned long  pdp_cnt;                //pdp个数unival        par[MAX_RRA_PAR_EN];} rra_def_t;说明：cf_nam：合并数据的类型。（PDP数据合成CDP数据时的类型）例如：RRA1.Rrdtool create first.rrd –start N --step 1  \DS:fir:COUNTER:2:U:U  \DS:sec:GAUGE:2:U:U \RRA:AVERAGE:0.5:1:60 \RRA:MAX:0.5:60:60 \RRA:MIN:0.5:3600:24 \RRA:LAST:0.5: 86400:7 \将60个，间隔时间为1s的数据（PDP）合成，计算其60个中最大的作为该RRA中的数据源（DS）的计算值进行存储。row_cnt：RRA的行数（每一行有所有数据源的数据）pdp_cnt:该RRA在合并数据时所占用的pdp数量。rra_def_t [0]. cf_nam = AVERAGErra_def_t [0]. row_cnt = 60rra_def_t [0]. pdp_cnt = 1rra_def_t [1]. cf_nam = AVERAGErra_def_t [1]. row_cnt = 60rra_def_t [1]. pdp_cnt = 60rra_def_t [2]. cf_nam = AVERAGErra_def_t [2]. row_cnt = 24rra_def_t [2]. pdp_cnt = 60*60rra_def_t [3]. cf_nam = AVERAGErra_def_t [3]. row_cnt = 7rra_def_t [3]. pdp_cnt = 60*60*24

小节：根据上面的分析，到现在应该清楚了RRD文件中RRA和DS的具体关系了。具体如下：活动头部：数据结构：typedef struct live_head_t {time_t           last_up;  //最后更新时间（秒）long            last_up_usec;     //最后更新毫秒} live_head_t;说明:last_up : RRD文件最后更新的时间(秒级)last_up_usec:RRD文件最后更新时间(微秒级)*仅一条数据ii.              PDP数据域：数据结构：typedef struct pdp_prep_t{char last_ds[LAST_DS_LEN];  //目前更新rrd 文件的数据unival        scratch[10];} pdp_prep_t;说明:unival        scratch[10]:该变量类型是一个结构体,变量的功能就是存储计算CDP,计算多长时间没有接受到数据,等相关的信息.在实际的rrd文件中PDP的数量为DS的数量.存储的是每个DS的相关数据信息(时间,真实数据).iii.              CDP数据域：typedef struct cdp_prep_t{unival         scratch[MAX_CDP_PAR_EN];} cdp_prep_t;说明:scratch:该变量存储了与计算CDP相关的数据,如多少个PDP没有数据(与该RRA中PDP的数量有关),目前CDP数据的计算值等信息.改CDP的数量与RRA的数量相同,同时每一条CDP数据里面包含所有的DS.简单的说就是CDP是RRA的缩小集合,目的是为计算相同RRA中下一条RRA记录做准备.iv.              RRA指针域：typedef struct rra_ptr_t {unsigned long    cur_row; //目前不同RRA数据已经更新到的//位置} rra_ptr_t;小节:到目前位置已经清楚的看到了RRD头文件的大体面貌,至于具体的结构体内部请参考相应的代码.RRD头文件结构图如下(根据上面创建命令绘制)1．RRD数据区：数据结构:typedef    double   rrd_value_t;  //RRD数据类型rrd_value_t      *rrd_value;            //RRD在内存中存储形式说明:RRD文件文件中除了RRD文件头部区域剩下的就是RRD文件数据区域.数据区域可以想象成为n*k*m 的矩阵,n为RRA的数量,k为不同RRA的行数,m为数据源DS的数量.RRD数据区域的图形请参考上面RRA与DS的小节.

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航