您的位置：首页 > 其它

spark【例子】倒排索引(InvertedIndex)

2016-08-02 11:24 746 查看

/* 倒排索引InvertedIndex */

val source = Source.fromFile("E:/cxsvn/txt/dp.txt").getLines.toArray
val cxRDD0 = sc.parallelize(source)                        /* spark单机读取数据 */

cxRDD0.flatMap {
lines =>
val line = lines.split("\\|", -1)                      /* 拆分数据，以竖杠为拆分条件 */
line(1).split(",", -1).map {                           /* 再对拆分后的数据，进行第二次拆分 */
v =>
(v, line(0))                                       /* 拼接数据 */
}
}.groupByKey()                                             /* 分组 */
.sortBy(_._1,true)                                         /* 排序 */
.foreach(x => println(s"${x._1}|${x._2.mkString(",")}"))   /* 格式化输出 */

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： scala spark 倒排索引

相关文章推荐

新的分享

章节导航