parquet压缩格式参数设置以及简单操作
2017-09-25 18:05
239 查看
Parquet 文件会在 gzip 中自动压缩,因为 Spark 变量 spark.sql.parquet.compression.codec 已在默认情况下设置为 gzip。您还可以将压缩编解码器设置为 uncompressed、snappy 或 lzo
object Save2Parquet {
def main(args: Array[String]): Unit = {
val conf = new SparkConf().setAppName("Save2Parquet").setMaster("local[2]")
// conf.set("spark.sql.parquet.compression.codec","uncompressed")
val sc = new SparkContext(conf)
val sqlContext = new SQLContext(sc)
// val DF = sqlContext.read.json("F:/03.hadoop/data/spark/sql/sqldf.json")
// DF.repartition(1)
// DF.write.parquet("F:/03.hadoop/data/a")
val DF = sqlContext.read.parquet("F:/03.hadoop/data/a/part-r-00000-7cb2b83b-9237-4e11-86a7-663eafa71fc7.gz.parquet")
DF.show()
sc.stop()
}
}
object Save2Parquet {
def main(args: Array[String]): Unit = {
val conf = new SparkConf().setAppName("Save2Parquet").setMaster("local[2]")
// conf.set("spark.sql.parquet.compression.codec","uncompressed")
val sc = new SparkContext(conf)
val sqlContext = new SQLContext(sc)
// val DF = sqlContext.read.json("F:/03.hadoop/data/spark/sql/sqldf.json")
// DF.repartition(1)
// DF.write.parquet("F:/03.hadoop/data/a")
val DF = sqlContext.read.parquet("F:/03.hadoop/data/a/part-r-00000-7cb2b83b-9237-4e11-86a7-663eafa71fc7.gz.parquet")
DF.show()
sc.stop()
}
}
相关文章推荐
- 分享 原创的一个模拟鼠标键盘操作的 设置简单 示例可以模拟向QQ群,以及QQ群内成员发送信息。
- C#中操作Excel(4)—— 向Excel中插入两种图表以及设置图表格式
- caffe 实战系列:proto文件格式以及含义解析:如何定义网络,如何设置网络参数(以AlexNet为例)
- dhtmlTree简单实例以及基本参数设置
- MATLAB 支持的文件格式 以及简单的操作函数
- dhtmlTree简单实例以及基本参数设置
- caffe 实战系列:proto文件格式以及含义解析:如何定义网络,如何设置网络参数(以AlexNet为例) 2016.3.30
- POI对Excel单元格的格式的设置参数
- bootbox自定义dialog、confirm、alert样式,以及基本设置方法setDefaults中可用参数
- java Calendar类时间操作简单总结,计算工作日排除法定假日以及周末
- SpringMVC(5):MVC的参数传递详解与示例(简单类型数据、ModelAndView、Model 、 POJO 以及 Map)
- CoreData的简单使用<一、CoreData数据库表的建立以及增删改查操作>
- javaCV开发详解之7:让音频转换更加简单,实现通用音频编码格式转换、重采样等音频参数的转换功能(以pcm16le编码的wav转mp3为例)
- 编辑器中材质参数设置以及记录保存功能
- 如何设置VS2008 辅助编译代码提示相关函数以及相关函数的参数
- WebRTC音视频引擎研究(2)--VoiceEngine音频编解码器数据结构以及参数设置
- MySQL5.7安装过程以及参数和设置说明
- latex格式设置问题以及压缩…
- ubuntu ip设置(最简单操作)
- C# 操作 Excel 如何设置格式