saprk rdd使用中遇到的一个典型问题
2017-05-19 18:55
183 查看
最近公司在做推荐系统相关的项目, 目前使用的是spark2.1.1 中的ML 中的机器学习包ALS, 在开发的时候需要计算物品矩阵的相似度 这样就要涉及到两两矩阵进行计算,但是如何得到这两个矩阵, 已经得到了一个ItemFactor, 也有全部的item信息, 而向量呢就是根据这两个取值得到的, 为了体验一下楼主当时多low,看下图:写的多low,
itemFactors这个对象先取出所有的itemIds 到driver端, 然后又遍历itemFactors这个对象,得到其中每一个itemId,然后又根据collect到driver
的itemIds又得到一个向量,很明显,在executor端又使用了itemFactors这个对象,这是不行的,所以一直报空指针错误
相关文章推荐
- 使用Action创建一个JButton后,改变该按钮的名字可能会遇到意想不到的问题
- 使用session时候,遇到的一个问题(请求解决方法)
- myeclipse中使用debug时遇到的一个小问题
- 使用SSRS设计报表布局时遇到的一个奇怪问题
- 使用xcopy遇到的一个问题
- 使用SAX2的DefaultHandler遇到的一个问题
- 在IIS 6 中使用HTTP压缩(Compression)遇到的一个问题
- 使用Ajax遇到一个问题
- 在使用BizTalk时遇到一个很郁闷的问题 之解决篇
- ajax2级联动,遇到一个异步优先级问题,使用settimeout 解决
- 使用access时遇到的一个问题
- 使用lua和tolua++遇到的一个古怪问题
- 使用Cascadingdropdown控件遇到的一个问题
- struts中使用DispatchAction可能会遇到的一个问题
- 使用css expression遇到的一个问题
- SQLServer使用identity函数生成带有自增列临时表遇到的一个排序问题
- 在使用struts遇到的一个问题
- 使用AjaxPro与Session交互时遇到一个问题
- 使用Windows 7自带IIS(7.5)搭建FTP服务时遇到的一个奇怪问题
- IE7中使用AJAX遇到的一个问题