您的位置:首页 > 大数据 > 人工智能

http://airos.blog.51cto.com/10853324/1719870

2015-12-05 18:42 197 查看
初识Spark RDD
Spark 工作方式

    1、从外部数据创建输入RDD

    2、对RDD进行转化操作生成新的RDD

    3、需要被重复利用的中间结果RDD进行持久化操作,如 persist()

    4、使用行动操作触发一次并行计算,Spark对计算优化后再执行

创建RDD

    两种办法:1、分发驱动器程序中的对象集合 2、读取外部数据集

    以读取文件中的一个字符为例,分别给出Python代码

    Python:

 知识图谱如下



内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  Saprk Spark RDD