SparkSQL DataFrame常用操作(一)
2018-03-10 19:43
531 查看
DSL风格语法
DataFrame提供了一个领域特定语言(DSL)以方便操作结构化数据。下面是一些使用示例1、查看DataFrame中的内容,通过调用show方法
personDF.show
2、查看DataFrame部分列中的内容
查看name字段的数据personDF.select(personDF.col("name")).show
查看name字段的另一种写法
personDF.select("name").show
查看 name 和age字段数据
personDF.select(col("name"), col("age")).show
3、打印DataFrame的Schema信息
personDF.printSchema
4、查询所有的name和age,并将age+1
personDF.select(col("id"), col("name"), col("age") + 1).show
也可以这样:
personDF.select(personDF("id"), personDF("name"), personDF("age") + 1).show
5、过滤age大于等于25的
使用filter方法过滤personDF.filter(col("age") >= 25).show
6、统计年龄大于30的人数
personDF.filter(col("age")>30).count()
7、按年龄进行分组并统计相同年龄的人数
personDF.groupBy("age").count().show
喜欢就点赞评论+关注吧
感谢阅读,希望能帮助到大家,谢谢大家的支持!
相关文章推荐
- Spark-SQL之DataFrame操作大全
- SparkSQL操作RDD转DataFrame
- Spark SQL概述,DataFrames,创建DataFrames的案例,DataFrame常用操作(DSL风格语法),sql风格语法
- spark sql dataframe操作
- Spark-SQL之DataFrame操作大全
- sparkSQL学习记录DATAFrame操作
- Spark-SQL之DataFrame操作
- SparkSql之DataFrame操作
- Spark-SQL之DataFrame操作大全
- sparkSql DataFrame操作
- Spark-SQL之DataFrame操作大全
- Spark-SQL之DataFrame操作大全
- Spark-SQL之DataFrame操作大全
- Spark-SQL之DataFrame操作大全
- Spark-SQL 之DataFrame操作大全
- Spark-SQL之DataFrame操作大全
- Spark-SQL之DataFrame操作大全
- Spark-SQL之DataFrame操作大全
- Schema RDD(DataFrame)----Spark SQL操作
- Spark-SQL之DataFrame操作大全