淘宝Hadoop作业平台宙斯(zeus)开源
2013-05-04 10:27
507 查看
https://github.com/alibaba/zeus
从Hadoop任务的调试运行到生产任务的周期调度 宙斯支持任务的整个生命周期
从功能上来说,支持:
Hadoop MapReduce任务的调试运行
Hive任务的调试运行
Shell任务的运行
Hive元数据的可视化查询与数据预览
Hadoop任务的自动调度
完整的文档管理
调度中心,生产任务的调度环境,当任务调试通过后,在此处配置调度信息进行生产调度
1.设置配置项
在/web/src/main/filter/antx.properties 中对配置项进行设置
设置完成后,复制到${user.home}/antx.properties处
2.pom.xml本地jar地址修改
在/web/pom.xml中修改properties中的local.highcharts
因为此jar不在maven仓库中,此jar已经在/web/libs/highcharts-1.4.0.jar
将systemPath路径设置为绝对路径
3.数据库配置
zeus数据库:/web/src/main/resources/persistence.xml中对数据库进行配置
hive元数据库:/web/src/main/resources/templates/hive-site.xml中对Hive metastore数据库进行配置
4.打包
mvn package
打包在/web/target/exploded/zeus-web.war下
使用tomcat之类容器运行即可
以上步骤可以保证这个web项目正常启动,如果需要正式上线此项目,还需要配置以下内容:
1.动态模板配置
宙斯系统中有很多模板是可以动态修改的,包括以下一些,建议在正式运行之前都配置好
(1)首页展示内容 启动后参见页面指南
(2)首页通知内容 启动后参见页面指南
(3)hive 默认udf函数 com.taobao.zeus.jobs.sub.HiveJob实现TODO内容
2.登陆系统
宙斯不包含单独的注册系统
建议使用单点登陆来实现登陆
大致原理:
(1) web.xml添加一个filter,用来跳转到单点登陆系统
(2) Spring容器中添加一个Bean,实现com.taobao.zeus.web.Login.Filter.SSOLogin接口
3.配置hadoop相关环境 默认的hadoop-site.xml和hive-site.xml在 /web/src/main/resources/templates下
修改相应的配置以对应相应的hadoop集群
服务器安装hadoop和hive客户端,并将相应的配置写入环境变量中
4.超级管理员配置
在com.taobao.zeus.store.Super中进行配置
5.关于浏览器兼容性
默认只支持webkit内核的浏览器,建议使用chrome
可以扩大浏览器范围,方法:/web/src/main/java/com/taobao/zeus/web/platform/Platform.gwt.xml 中注释掉 user.agent 这一行
当然这样会大致打包时间加长(gwt为了兼容不同的浏览器会编译更多的代码,导致打包变慢)
即便如此,我们也不保证IE等浏览器能够正常使用!
从Hadoop任务的调试运行到生产任务的周期调度 宙斯支持任务的整个生命周期
从功能上来说,支持:
Hadoop MapReduce任务的调试运行
Hive任务的调试运行
Shell任务的运行
Hive元数据的可视化查询与数据预览
Hadoop任务的自动调度
完整的文档管理
调度中心,生产任务的调度环境,当任务调试通过后,在此处配置调度信息进行生产调度
1.设置配置项
在/web/src/main/filter/antx.properties 中对配置项进行设置
设置完成后,复制到${user.home}/antx.properties处
2.pom.xml本地jar地址修改
在/web/pom.xml中修改properties中的local.highcharts
因为此jar不在maven仓库中,此jar已经在/web/libs/highcharts-1.4.0.jar
将systemPath路径设置为绝对路径
3.数据库配置
zeus数据库:/web/src/main/resources/persistence.xml中对数据库进行配置
hive元数据库:/web/src/main/resources/templates/hive-site.xml中对Hive metastore数据库进行配置
4.打包
mvn package
打包在/web/target/exploded/zeus-web.war下
使用tomcat之类容器运行即可
以上步骤可以保证这个web项目正常启动,如果需要正式上线此项目,还需要配置以下内容:
1.动态模板配置
宙斯系统中有很多模板是可以动态修改的,包括以下一些,建议在正式运行之前都配置好
(1)首页展示内容 启动后参见页面指南
(2)首页通知内容 启动后参见页面指南
(3)hive 默认udf函数 com.taobao.zeus.jobs.sub.HiveJob实现TODO内容
2.登陆系统
宙斯不包含单独的注册系统
建议使用单点登陆来实现登陆
大致原理:
(1) web.xml添加一个filter,用来跳转到单点登陆系统
(2) Spring容器中添加一个Bean,实现com.taobao.zeus.web.Login.Filter.SSOLogin接口
3.配置hadoop相关环境 默认的hadoop-site.xml和hive-site.xml在 /web/src/main/resources/templates下
修改相应的配置以对应相应的hadoop集群
服务器安装hadoop和hive客户端,并将相应的配置写入环境变量中
4.超级管理员配置
在com.taobao.zeus.store.Super中进行配置
5.关于浏览器兼容性
默认只支持webkit内核的浏览器,建议使用chrome
可以扩大浏览器范围,方法:/web/src/main/java/com/taobao/zeus/web/platform/Platform.gwt.xml 中注释掉 user.agent 这一行
当然这样会大致打包时间加长(gwt为了兼容不同的浏览器会编译更多的代码,导致打包变慢)
即便如此,我们也不保证IE等浏览器能够正常使用!
宙斯(zeus)是什么
宙斯是一个完整的Hadoop的作业平台从Hadoop任务的调试运行到生产任务的周期调度 宙斯支持任务的整个生命周期
从功能上来说,支持:
Hadoop MapReduce任务的调试运行
Hive任务的调试运行
Shell任务的运行
Hive元数据的可视化查询与数据预览
Hadoop任务的自动调度
完整的文档管理
宙斯开源,不仅仅是开源技术,更是开源产品
开发中心,一个文档管理,开发调试的环境,在任务上线前的主要工作区域调度中心,生产任务的调度环境,当任务调试通过后,在此处配置调度信息进行生产调度
宙斯运行原理
使用指南
快速启动(Quick Start):1.设置配置项
在/web/src/main/filter/antx.properties 中对配置项进行设置
设置完成后,复制到${user.home}/antx.properties处
2.pom.xml本地jar地址修改
在/web/pom.xml中修改properties中的local.highcharts
因为此jar不在maven仓库中,此jar已经在/web/libs/highcharts-1.4.0.jar
将systemPath路径设置为绝对路径
3.数据库配置
zeus数据库:/web/src/main/resources/persistence.xml中对数据库进行配置
hive元数据库:/web/src/main/resources/templates/hive-site.xml中对Hive metastore数据库进行配置
4.打包
mvn package
打包在/web/target/exploded/zeus-web.war下
使用tomcat之类容器运行即可
以上步骤可以保证这个web项目正常启动,如果需要正式上线此项目,还需要配置以下内容:
1.动态模板配置
宙斯系统中有很多模板是可以动态修改的,包括以下一些,建议在正式运行之前都配置好
(1)首页展示内容 启动后参见页面指南
(2)首页通知内容 启动后参见页面指南
(3)hive 默认udf函数 com.taobao.zeus.jobs.sub.HiveJob实现TODO内容
2.登陆系统
宙斯不包含单独的注册系统
建议使用单点登陆来实现登陆
大致原理:
(1) web.xml添加一个filter,用来跳转到单点登陆系统
(2) Spring容器中添加一个Bean,实现com.taobao.zeus.web.Login.Filter.SSOLogin接口
3.配置hadoop相关环境 默认的hadoop-site.xml和hive-site.xml在 /web/src/main/resources/templates下
修改相应的配置以对应相应的hadoop集群
服务器安装hadoop和hive客户端,并将相应的配置写入环境变量中
export HADOOP_HOME=hadoop_home_path export HADOOP_CONF_DIR=$HADOOP_HOME/conf export HIVE_HOME=hive_home_path export HIVE_CONF_DIR=$HIVE_HOME/conf export HIVE_LIB=${HIVE_HOME}/lib export HIVE_AUX_JARS_PATH=udf_jar_path
4.超级管理员配置
在com.taobao.zeus.store.Super中进行配置
5.关于浏览器兼容性
默认只支持webkit内核的浏览器,建议使用chrome
可以扩大浏览器范围,方法:/web/src/main/java/com/taobao/zeus/web/platform/Platform.gwt.xml 中注释掉 user.agent 这一行
当然这样会大致打包时间加长(gwt为了兼容不同的浏览器会编译更多的代码,导致打包变慢)
即便如此,我们也不保证IE等浏览器能够正常使用!
宙斯(zeus)是什么
宙斯是一个完整的Hadoop的作业平台从Hadoop任务的调试运行到生产任务的周期调度 宙斯支持任务的整个生命周期
从功能上来说,支持:
Hadoop MapReduce任务的调试运行
Hive任务的调试运行
Shell任务的运行
Hive元数据的可视化查询与数据预览
Hadoop任务的自动调度
完整的文档管理
宙斯开源,不仅仅是开源技术,更是开源产品
开发中心,一个文档管理,开发调试的环境,在任务上线前的主要工作区域调度中心,生产任务的调度环境,当任务调试通过后,在此处配置调度信息进行生产调度
宙斯运行原理
使用指南
快速启动(Quick Start):1.设置配置项
在/web/src/main/filter/antx.properties 中对配置项进行设置
设置完成后,复制到${user.home}/antx.properties处
2.pom.xml本地jar地址修改
在/web/pom.xml中修改properties中的local.highcharts
因为此jar不在maven仓库中,此jar已经在/web/libs/highcharts-1.4.0.jar
将systemPath路径设置为绝对路径
3.数据库配置
zeus数据库:/web/src/main/resources/persistence.xml中对数据库进行配置
hive元数据库:/web/src/main/resources/templates/hive-site.xml中对Hive metastore数据库进行配置
4.打包
mvn package
打包在/web/target/exploded/zeus-web.war下
使用tomcat之类容器运行即可
以上步骤可以保证这个web项目正常启动,如果需要正式上线此项目,还需要配置以下内容:
1.动态模板配置
宙斯系统中有很多模板是可以动态修改的,包括以下一些,建议在正式运行之前都配置好
(1)首页展示内容 启动后参见页面指南
(2)首页通知内容 启动后参见页面指南
(3)hive 默认udf函数 com.taobao.zeus.jobs.sub.HiveJob实现TODO内容
2.登陆系统
宙斯不包含单独的注册系统
建议使用单点登陆来实现登陆
大致原理:
(1) web.xml添加一个filter,用来跳转到单点登陆系统
(2) Spring容器中添加一个Bean,实现com.taobao.zeus.web.Login.Filter.SSOLogin接口
3.配置hadoop相关环境 默认的hadoop-site.xml和hive-site.xml在 /web/src/main/resources/templates下
修改相应的配置以对应相应的hadoop集群
服务器安装hadoop和hive客户端,并将相应的配置写入环境变量中
export HADOOP_HOME=hadoop_home_path export HADOOP_CONF_DIR=$HADOOP_HOME/conf export HIVE_HOME=hive_home_path export HIVE_CONF_DIR=$HIVE_HOME/conf export HIVE_LIB=${HIVE_HOME}/lib export HIVE_AUX_JARS_PATH=udf_jar_path
4.超级管理员配置
在com.taobao.zeus.store.Super中进行配置
5.关于浏览器兼容性
默认只支持webkit内核的浏览器,建议使用chrome
可以扩大浏览器范围,方法:/web/src/main/java/com/taobao/zeus/web/platform/Platform.gwt.xml 中注释掉 user.agent 这一行
当然这样会大致打包时间加长(gwt为了兼容不同的浏览器会编译更多的代码,导致打包变慢)
即便如此,我们也不保证IE等浏览器能够正常使用!
相关文章推荐
- 一个以可视化界面的方式管理与调度Hadoop的作业平台——Zeus
- zeus作业平台在hadoop2.x中的安装部署
- 宙斯是一个完整的Hadoop的作业平台[转]
- zeus作业平台在hadoop2.x中的安装部署
- [Hadoop in China 2011] HBase在淘宝平台上的应用和改进经验
- (转).Net平台开源作业调度框架Quartz.Net
- LVS开源创始人之淘宝低碳平台构建
- 炼数成金-Hadoop数据分析平台-第1周-作业
- 让作业飞吧,与屌丝兄弟们分享我的分布式作业调度平台 【拥抱开源,拥抱作业调度的神器Quartz.net】
- Hadoop 开源调度系统zeus(二)
- 走进淘宝开源平台
- 新书推荐-hadoop开源计算平台
- Hadoop平台作业参数设置关于mapreduce.job.split.metainfo.maxsize的说明
- 淘宝开源平台(taobao
- 超级强大的淘宝开源平台(taobao-code)
- 超级强大的淘宝开源平台(taobao-code)
- TaoCode-淘宝的SVN开源托管平台
- 淘宝开源平台“ 淘蝌蚪”正式上线
- 开源第三方登录组件OAuthLogin2.0 支持QQ,阿里巴巴,淘宝,京东,蘑菇街,有赞等平台