spark的几点备忘
2013-12-03 00:00
876 查看
spark如果运行在分布式环境下。处理文件需要使用分布式文件系统。比如运行:
<!-- lang: shell -->
./run-example org.apache.spark.examples.SparkPageRank spark://192.168.0.103:7077 /home/xx/data/pagerank_data.txt 100
远程worker如果没有本地文件/home/xx/data/pagerank_data.txt就会报错。
连接master(比如:worker,spark_shell等)报错
<!-- lang: shell -->
13/12/03 14:27:58 ERROR NettyRemoteTransport(null): dropping message RegisterApplication(ApplicationDescription(PageRank)) for non-local recipient akka://sparkMaster@192.168.0.103:7077/user/Master at akka://sparkMaster@error.d:7077 local is akka://sparkMaster@error.d:7077
13/12/03 14:27:58 ERROR NettyRemoteTransport(null): dropping message DaemonMsgWatch(Actor[akka://spark@192.168.0.103:58493/user/$a],Actor[akka://sparkMaster@192.168.0.103:7077/user/Master]) for non-local recipient akka://sparkMaster@192.168.0.103:7077/remote at akka://sparkMaster@error.d:7077 local is akka://sparkMaster@error.d:7077
需要使用域名连接,比如
<!-- lang: shell -->
./run-example org.apache.spark.examples.SparkPageRank spark://error.d:7077 /home/xx/data/pagerank_data.txt 100
<!-- lang: shell -->
./run-example org.apache.spark.examples.SparkPageRank spark://192.168.0.103:7077 /home/xx/data/pagerank_data.txt 100
远程worker如果没有本地文件/home/xx/data/pagerank_data.txt就会报错。
连接master(比如:worker,spark_shell等)报错
<!-- lang: shell -->
13/12/03 14:27:58 ERROR NettyRemoteTransport(null): dropping message RegisterApplication(ApplicationDescription(PageRank)) for non-local recipient akka://sparkMaster@192.168.0.103:7077/user/Master at akka://sparkMaster@error.d:7077 local is akka://sparkMaster@error.d:7077
13/12/03 14:27:58 ERROR NettyRemoteTransport(null): dropping message DaemonMsgWatch(Actor[akka://spark@192.168.0.103:58493/user/$a],Actor[akka://sparkMaster@192.168.0.103:7077/user/Master]) for non-local recipient akka://sparkMaster@192.168.0.103:7077/remote at akka://sparkMaster@error.d:7077 local is akka://sparkMaster@error.d:7077
需要使用域名连接,比如
<!-- lang: shell -->
./run-example org.apache.spark.examples.SparkPageRank spark://error.d:7077 /home/xx/data/pagerank_data.txt 100
相关文章推荐
- Spark随谈——开发指南(译)
- Spark,一种快速数据分析替代方案
- C# 大数据导出word的假死报错的处理方法
- mongodb常遇到的错误。
- Python 大数据思维导图
- 量子计算机编程原理简介 和 机器学习
- 参加2013大数据全球技术峰会有感
- 14项与大数据相关的技能和工作
- 大数据时代的热门职业
- 大数据,且行且思( 文/ 占超群)
- 大数据时代的来临 大数据之“大”
- 大数据时代,品牌如何营销?
- 移动互联应用:企业在大数据时代的制胜法宝
- 神经网络初步学习手记
- 大数据时代的营销策略
- 今晚《北京来袭》开源力量公开课--云开两朵,各表一枝–公、私有云架构异同点与难点
- 关注云计算、大数据的IT技术以及最新资讯动态
- 开始spark之旅