关于在windows平台下使用ipython运行pyspark的问题
2015-11-20 15:46
621 查看
最近读了一本书<machine learning with spark> ,在第三章中讲到用增强的交互式ipython运行pyspark,也就是用如下命令:
> IPYTHON=1 IPYTHON_OPTS="--pylab" ./bin/pyspark
本人在windows平台下的shell中跑spark,上述命令运行失败。查阅了多个文献,大都是讲在linux平台下的ipython配置来运行 pyspark。在 spark的conf目录下配置也不起作用,这下犯难了!!!
假设您已经安装了 python及相关的库,下面是解决办法:
在spark配置文件中,%SPARK_HOME%/bin目录下有pypspark, pyspark.cmd, pyspark2.cmd三个文件,第一个是.sh文件(linux),第二、三个windows的脚本文件,其中pyspark2.cmd是主要执行文件,其内容如下:
-------------------------------------------------------------------------------------------------------------------------------------------------------------
set SPARK_HOME=%~dp0..
call %SPARK_HOME%\bin\load-spark-env.cmd
set _SPARK_CMD_USAGE=Usage: bin\pyspark.cmd [options]
rem Figure out which Python to use.
if "x%PYSPARK_DRIVER_PYTHON%"=="x" (
set PYSPARK_DRIVER_PYTHON=python
if not [%PYSPARK_PYTHON%] == [] set PYSPARK_DRIVER_PYTHON=%PYSPARK_PYTHON%
)
set PYTHONPATH=%SPARK_HOME%\python;%PYTHONPATH%
set PYTHONPATH=%SPARK_HOME%\python\lib\py4j-0.8.2.1-src.zip;%PYTHONPATH%
set OLD_PYTHONSTARTUP=%PYTHONSTARTUP%
set PYTHONSTARTUP=%SPARK_HOME%\python\pyspark\shell.py
call %SPARK_HOME%\bin\spark-submit2.cmd pyspark-shell-main --name "PySparkShell" %*
-------------------------------------------------------------------------------------------------------------------------------------------------------------------
PYSPARK_DRIVER_PYTHON参数是指用什么来运行pyspark,只需要将红色部分改为
PYSPARK_DRIVER_PYTHON=ipython
保存后,在运行pyspark,就可以直接用ipython运行pyspark了。
> IPYTHON=1 IPYTHON_OPTS="--pylab" ./bin/pyspark
本人在windows平台下的shell中跑spark,上述命令运行失败。查阅了多个文献,大都是讲在linux平台下的ipython配置来运行 pyspark。在 spark的conf目录下配置也不起作用,这下犯难了!!!
假设您已经安装了 python及相关的库,下面是解决办法:
在spark配置文件中,%SPARK_HOME%/bin目录下有pypspark, pyspark.cmd, pyspark2.cmd三个文件,第一个是.sh文件(linux),第二、三个windows的脚本文件,其中pyspark2.cmd是主要执行文件,其内容如下:
-------------------------------------------------------------------------------------------------------------------------------------------------------------
set SPARK_HOME=%~dp0..
call %SPARK_HOME%\bin\load-spark-env.cmd
set _SPARK_CMD_USAGE=Usage: bin\pyspark.cmd [options]
rem Figure out which Python to use.
if "x%PYSPARK_DRIVER_PYTHON%"=="x" (
set PYSPARK_DRIVER_PYTHON=python
if not [%PYSPARK_PYTHON%] == [] set PYSPARK_DRIVER_PYTHON=%PYSPARK_PYTHON%
)
set PYTHONPATH=%SPARK_HOME%\python;%PYTHONPATH%
set PYTHONPATH=%SPARK_HOME%\python\lib\py4j-0.8.2.1-src.zip;%PYTHONPATH%
set OLD_PYTHONSTARTUP=%PYTHONSTARTUP%
set PYTHONSTARTUP=%SPARK_HOME%\python\pyspark\shell.py
call %SPARK_HOME%\bin\spark-submit2.cmd pyspark-shell-main --name "PySparkShell" %*
-------------------------------------------------------------------------------------------------------------------------------------------------------------------
PYSPARK_DRIVER_PYTHON参数是指用什么来运行pyspark,只需要将红色部分改为
PYSPARK_DRIVER_PYTHON=ipython
保存后,在运行pyspark,就可以直接用ipython运行pyspark了。
相关文章推荐
- Python中sorted()方法的用法
- Python编程中使用Pillow来处理图像的基础教程
- [python]print简单用法和读取用户输入
- python 读写JSON数据
- 在Mac OS系统上安装Python的Pillow库的教程
- 详解Python编程中time模块的使用
- Python多进程编程
- Windows上配置Emacs来开发Python及用Python扩展Emacs
- 将Emacs打造成强大的Python代码编辑工具
- 【python游戏编程之旅】第三篇---pygame事件与设备轮询
- Python 实现单向链表
- Python 列表(list)、字典(dict)、字符串(string)常用基本操作小结
- selenium webdriver python 元素操作
- selenium webdriver python 元素定位
- Python中的GIL、多进程和多线程
- 如何用python语句获得Python的安装目录
- 【python】关于python 安装包时报错问题
- python3中替换python2中cmp函数的新函数分析(lt、le、eq、ne、ge、gt)
- selenium webdriver python 等待
- selenium webdriver python 操作浏览器