微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

spark mapPartition

mapPartition 是一个transformation 算子,主要针对需要建立连接的程序,比如数据写入数据库

 val kzc=spark.sparkContext.parallelize(List(("hive",8),("apache",8),("hive",30),("hadoop",18)),2)
    val bd=spark.sparkContext.parallelize(List(("hive",8),("test",2),("spark",20)),1)
    val result=bd.union(kzc)
    println(result.partitions.size)
    println("*******************")
    val result2=result.mapPartitions(elements=>{
      val result=new  scala.collection.mutable.ListBuffer[(String,Int)]()
     while(elements.hasNext){
      val a=elements.next()
       result.append(a)
     }
      result.iterator
    })
      result2.collect().foreach(println(_))

 

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐