groovy分析脚本基本组成文件详解和运行过程中出错分析
2015-01-30 10:31
288 查看
在本公司搭建的hadoop运行平台上,主要利用groovy进行数据分析并输出分析结果到数据库报表。每一个分析需要编写DataTypeConfig.xml、ReportConfig.xml和.groovy脚本文件。在进行数据分析的过程中,也会出现一些常见的错误,现在逐步总结如下。
一、DataTypeConfig.xml、ReportConfig.xml和.groovy脚本文件字段分析
图1.1
图1.2
图1.3
如图所示。其中,DataTypeConfig.xml的name参数(A1)暂未发现有什么作用,一般不用关注;DataTypeConfig.xml的path字段(A2)和ReportConfig.xml的input字段(B3)保持一致,值为数据输入路径;DataTypeConfig.xml的script字段(A3)值为.groovy脚本文件[b]存放路径;ReportConfig.xml的name参数(B1)与.groovy脚本文件的C1字段保持一致,一般设置为该业务统计的名称;ReportConfig.xml的name参数(B2)用于外界(比如workflow等)调用该groovy统计分析,一般设在该业务统计的名称加上"_task"。[/b]
二、分析脚本在hadoop平台运行出错分析
1.groovy脚本处理生成的中间过程数据不存在
首先关注信息0,分析数据输入路径没有提示不存在,表示输入路径没有问题;再看信息1,此时提示不存在进而信息2也提示不存在,表示输入数据经过groovy脚本分析生成的中间数据不存在,数据在分析过程中被“过滤”掉了。原因可能在两个方面:分析代码有bug或者输入数据内容有问题。
一、DataTypeConfig.xml、ReportConfig.xml和.groovy脚本文件字段分析
图1.1
图1.2
图1.3
如图所示。其中,DataTypeConfig.xml的name参数(A1)暂未发现有什么作用,一般不用关注;DataTypeConfig.xml的path字段(A2)和ReportConfig.xml的input字段(B3)保持一致,值为数据输入路径;DataTypeConfig.xml的script字段(A3)值为.groovy脚本文件[b]存放路径;ReportConfig.xml的name参数(B1)与.groovy脚本文件的C1字段保持一致,一般设置为该业务统计的名称;ReportConfig.xml的name参数(B2)用于外界(比如workflow等)调用该groovy统计分析,一般设在该业务统计的名称加上"_task"。[/b]
二、分析脚本在hadoop平台运行出错分析
1.groovy脚本处理生成的中间过程数据不存在
首先关注信息0,分析数据输入路径没有提示不存在,表示输入路径没有问题;再看信息1,此时提示不存在进而信息2也提示不存在,表示输入数据经过groovy脚本分析生成的中间数据不存在,数据在分析过程中被“过滤”掉了。原因可能在两个方面:分析代码有bug或者输入数据内容有问题。
相关文章推荐
- FreeMarker模板文件的组成及基本语法详解(二
- FreeMarker模板文件的组成及基本语法详解(一)
- MySQL--物理文件组成基本配置详解
- FreeMarker模板文件的组成及基本语法详解(二)
- Android运行时ART加载OAT文件的过程分析
- SSM框架day02-MyBatis——014 DB连接池工作原理分析、015详解主配置文件-为类指定别名、016详解主配置文件-运行环境配置
- 编码问题导致python脚本运行时出错: 没有那个文件或目录
- Loadrunner脚本回放 场景运行过程中常见错误分析
- 从一个精简Linux内核分析操作系统的基本运行过程
- FreeMarker模板文件的组成及基本语法详解
- FreeMarker基本语法详解及模板文件的组成(一)
- Highcharts图表结构分析:详解Highcharts基本组成
- 【已解决】安装Scrapy过程中出错:ERROR: ‘xslt-config’ 不是内部或外部命令,也不是可运行的程序 或批处理文件。
- Loadrunner脚本回放 场景运行过程中常见错误分析
- response.setHeader()的用法详解及实现文件下载过程中出现问题的分析
- 从一个精简Linux内核分析操作系统的基本运行过程
- 5.分析内核中断运行过程,以及中断3大结构体:irq_desc、irq_chip、irqaction(详解)
- FreeMarker模板文件的组成及基本语法详解
- Loadrunner 脚本回放 场景运行过程中 常见错误分析
- 日志文件分析shell脚本六次提速过程