pycharm搭建spark环境
2018-08-20 17:37
190 查看
pycharm搭建spark环境
安装python环境
windows下有安装包,自行下载安装即可
安装spark环境
官网下载
配置
配置python-spark环境
将spark目录
将解压后的
提示:python 和 spark 的安装目录自行替换
下载安装pycharm
创建项目
创建python文件,内容如下:
点击run运行,结果如下:
运行是没有问题,但是在pycharm中,
点击File->Settings,在左侧导航栏找到自己的项目,点击
安装python环境
windows下有安装包,自行下载安装即可
安装spark环境
官网下载
spark-2.3.1-bin-hadoop2.7包,解压即可
配置
HADOOP_HOME:D:\softwares\Java\hadoop-2.7.7 SPARK_HOME:D:\softwares\Java\spark-2.3.1-bin-hadoop2.7 PATH:%SPARK_HOME%\bin;%HADOOP_HOME%\bin;
配置python-spark环境
将spark目录
D:\softwares\Java\spark-2.3.1-bin-hadoop2.7\python\lib下的
py4j-0.10.7-src.zip解压
将解压后的
py4j放到 python 目录
D:\softwares\Java\Python36\Lib\site-packages下
提示:python 和 spark 的安装目录自行替换
下载安装pycharm
创建项目
创建python文件,内容如下:
from pyspark import SparkConf, SparkContext conf = SparkConf().setMaster('local').setAppName('JackManWu') sc = SparkContext(conf=conf) lines = sc.textFile("D:\softwares\Java\spark-2.3.1-bin-hadoop2.7\README.md") print(lines.count())
点击run运行,结果如下:
2018-08-20 17:30:13 WARN NativeCodeLoader:62 - Unable to load native-hadoop library for your platform... using builtin-java classes where applicable Setting default log level to "WARN". To adjust logging level use sc.setLogLevel(newLevel). For SparkR, use setLogLevel(newLevel). 2018-08-20 17:30:15 WARN Utils:66 - Service 'SparkUI' could not bind on port 4040. Attempting port 4041. 103
运行是没有问题,但是在pycharm中,
pyspark,
SparkConf和
SparkContext会有红色波浪线,而且也没有spark的代码智能提示、补全等,极不方便,如下方法可以解决:
点击File->Settings,在左侧导航栏找到自己的项目,点击
Project Structure,在面板右侧,点击
Add Content Root,将spark目录
D:\softwares\Java\spark-2.3.1-bin-hadoop2.7\python\lib下的
pyspark.zip的文件添加进项目中,即可解决红色波浪线及智能提示补全问题。
相关文章推荐
- windows7 + pycharm 搭建spark的python开发环境,Java gateway process exited before sending the driver its port
- windows7 spark单机环境搭建及pycharm访问spark
- window7下在pycharm上配置pyspark 搭建spark测试环境
- 分别用Eclipse和IDEA搭建Scala+Spark开发环境
- Windows 上使用Intellij DEAR14 搭建Spark14编程环境总结
- 初步探索python(三) pycharm开发环境搭建,爬虫
- 搭建hadoop/spark集群环境
- Spark 1.6.1分布式集群环境搭建
- hadoop2.7.3+spark2.1.0+scala2.12.1环境搭建(2)安装hadoop
- spark 1.5、hadoop 2.7 集群环境搭建
- 在windows下搭建spark1.x开发环境小记(winutils.exe找不到报错)
- Windows7+Pycharm搭建Spark的开发环境
- 大数据1-hadoop、zookeeper、hbase、spark集群环境搭建
- Hadoop2.7.3+Spark2.1.0 完全分布式环境 搭建全过程
- CentOS7 从零搭建Spark 2.0 单机环境
- spark2.2.0搭建standalone集群环境
- Kafka:ZK+Kafka+Spark Streaming集群环境搭建(二十三)Structured Streaming遇到问题:Set(TopicName-0) are gone. Some data may have been missed
- Spark集群环境搭建
- python环境搭建-设置PyCharm软件的配色方案和Python解释器