您的位置：首页 > 数据库

spark-sql读取hive

2016-11-16 15:27 232 查看

Spark-1.3.1与Hive整合实现查询分析

操作步骤

1.我们可以通过指定SPARK_CLASSPATH变量，将需要访问Hive的元数据存储MySQL的驱动包加入进去，然后直接启动Spark SQL Shell即可。

SPARK_CLASSPATH="$SPARK_CLASSPATH:/app/apache-hive-1.2.1-bin/lib/mysql-connector-java-5.1.38-bin.jar"

2.通过Spark Shell进行操作，不过需要了解Spark SQL支持的Scala API，启动Spark Shell，执行如下命令：

spark-shell --master local[1]

3.然后，创建一个org.apache.spark.sql.hive.HiveContext对象，用来执行Hive查询：

val sqlContext = new org.apache.spark.sql.hive.HiveContext(sc)

sqlContext.sql("select imsi from test.test_weixin limit 2").collect().foreach(println)

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： spark-sql

相关文章推荐

Spark SQL来读取现有Hive中的数据
SparkSQL读取HBase数据，通过自定义外部数据源（hbase的Hive外关联表）
sparkSQL读取hive分区表的问题追踪
[Spark][Hive][Python][SQL]Spark 读取Hive表的小例子
spark SQL （五）数据源 Data Source----json hive jdbc等数据的的读取与加载
SparkSQL读取Hive中的数据
spark-sql读取hive挂载alluxio
SparkSQL读取Hive中的数据
spark-sql读取映射hbase数据的hive外部表
spark-sql读取映射hbase数据的hive外部表
sparksql读取hive数据源配置
Spark SQL读取hive数据时报找不到mysql驱动
SparkSQL读取Hive中的数据
Java实现SparkSQL Thrift方式读取Hive数据
[spark]spark读取postgresql的表（纯SQL方式）
SparkSQL On Yarn with Hive，操作和访问Hive表
spark-sql 不兼容的hive语法列表
Spark SQL+Hive历险记
基于Spark的Hive编程中，“Error:(8, 37) java: 程序包org.apache.spark.sql.api.java不存在”的解决办法
SparkSQL与Hive的应用关系

新的分享

腾讯云数据库TDSQL-大咖论道 | 基础软件的过去、现在、未来
腾讯云数据库TDSQL｜像这样的高考，其实我们每天都在经历
ES既是搜索引擎又是数据库？真的有那么全能吗？ - 更多
解放双手，数据库智能调参CDBTune等你来测
直播问答丨31问工行分布式数据库选型及设计 - 分布式
您的DBS已上线！解决混合云数据库一站式备份若干问题
腾讯云数据库｜一文解读沙利文2021年中国分布式数据库市场报告
做数据时代的加油站，ShardingSphere 为易车数据库架构演进提供新动力
工行“去O”数据库选型与分布式架构设计 - 分布式
数据库治理的云原生之道 —— Database Mesh 2.0
数仓选型必列入考虑的OLAP列式数据库ClickHouse（上）
Flask框架(flask-sqlalchemy操作，Migrate作用，Flask迁移数据库，Flaks同步表数据，)

章节导航