微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Spark RDD 练习题一

Tom,DataBase,80 Tom,Algorithm,50 Tom,DataStructure,60 Jim,DataBase,90 Jim,Algorithm,60 Jim,DataStructure,80 ……   (1) 该系总共有多少学生;

scala> val rdd = sc.textFile("/testfile/chapter5-data1.txt")

// 切分每一行,取到第一个name元素组成新的RDD

scala> val nameRDD = rdd.map(row => row.split(",")(0))
// 去重

scala> val result = nameRDD.distinct()
// 统计总数

scala> result.count
rES10: Long = 265

  (2)该系共开设来多少门课程;

scala> val classRDD = rdd.map(row => row.split(",")(1))

scala> val result = classRDD.distinct()

scala> result.count
res11: Long = 8

 

 

(3) Tom 同学的总成绩平均分是多少;              

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐