Hive metastore三种存储方式
2015-08-12 09:19
239 查看
测试环境下Hive总出问题,metastore的配置有问题。抽了点时间,把Hive的meta数据几种存储方式都配置了下。Hive的meta 数据支持以下三种存储方式,其中两种属于本地存储,一种为远端存储。远端存储比较适合生产环境。Hive官方wiki详细介绍了这三种方式,链接为:Hive
Metastore 。
一、使用derby数据库存储元数据。
这种方式是最简单的存储方式,只需要在hive-default.xml或hive-site.xml做如下配置便可。
?
使用derby存储方式时,运行hive会在当前目录生成一个derby文件和一个metastore_db目录。这种存储方式的弊端是在同一个目录下同时只能有一个hive客户端能使用数据库,否则会提示如下错误(这是一个很常见的错误)。
?
二、使用本机mysql服务器存储元数据。这种存储方式需要在本地运行一个mysql服务器,并作如下配置(下面两种使用mysql的方式,需要将mysql的jar包拷贝到$HIVE_HOME/lib目录下)。
?
三、使用远端mysql服务器存储元数据。这种存储方式需要在远端服务器运行一个mysql服务器,并且需要在Hive服务器启动meta服务。
1)Hive服务器端配置如下。
?
2)Hive客户端配置如下。
?
3)服务进程启动如下,默认监听的端口是9083(Hive版本低于0.5的才这样启动)。
?
这里配置classpath太麻烦了,要把hadoop和hive的jar包都加到classpath上,手动加容易导致依赖错误。我写了一个简单的脚本,把$HIVE_HOME/lib下的jar全部连起来,用冒号分隔开。脚本代码如下。
?
运行时,只需要输入”./generate_classpath.sh $HIVE_HOME/lib”便可。然后将生成的字符串贴到.bashrc中,赋给CLASSPATH变量。
hive启动时有一个选项”–config”可以指定包含启动客户端用的配置文件的目录,该目录下需要有hive-default.xml或hive-site.xml文件。
?
根据我的实践发现,其实第二种方法也可以将Hive的元数据保存到一台远端服务器上,只要配置好javax.jdo.option.ConnectionURL这个连接串就行。
Metastore 。
一、使用derby数据库存储元数据。
这种方式是最简单的存储方式,只需要在hive-default.xml或hive-site.xml做如下配置便可。
?
?
?
1)Hive服务器端配置如下。
?
?
?
?
hive启动时有一个选项”–config”可以指定包含启动客户端用的配置文件的目录,该目录下需要有hive-default.xml或hive-site.xml文件。
?
相关文章推荐
- javascript中的回调函数(callback)
- Automotive Security的一些资料和心得(6):AUTOSAR
- 简单返回顶部代码及注释说明
- mysql_insert_id()寻找上一次插入的id
- PDF之itextsharp的使用开发历程3
- poj-3349-Snowflake Snow Snowflakes-哈希
- 关于多态的一些自己理解
- buffer和cache的区别
- 笔记
- 常用的正则表达式资料整理
- nginx与Apache的优缺点
- 使用NSURLConnection发送http网络请求
- ionic 项目中添加modal的步骤流程
- 获取访问者的真实IP地址,绕过路由映射等
- ios开发(plist文件数据加载) 使用数据模型的方法加载plist文件中的数据
- 黑马程序员——Java基础多态、内部类、异常
- 程序员如何持续提升自己的开发技能
- requirejs 跨域
- android 中Dialog的一些用法
- wpf GridSplitter