微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

怎么解析SparkCore和SparkSQL

这篇文章将为大家详细讲解有关怎么解析SparkCore和Sparksql文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。

下面将通过7个简单的小练习,对比示范SparkCore和Sparksql编程的方法。除了WordCount词频统计这个典型的处理非结构数据的例子外,下面示范的大部分例子中,使用Sparksql的编程接口都会更加简洁易懂。

怎么解析SparkCore和SparkSQL

一,求平均值

问题:给定一组整数,求它们的平均值。

(注意:这些整数可能加起来会很大,要考虑溢出可能)

怎么解析SparkCore和SparkSQL

怎么解析SparkCore和SparkSQL

二,WordCount词频统计

问题:读取文档中的单词,统计每个单词出现的词数。

怎么解析SparkCore和SparkSQL

怎么解析SparkCore和SparkSQL

三,求TopN

问题:给定学生姓名和成绩等信息,找出成绩前三名的学生。

怎么解析SparkCore和SparkSQL

怎么解析SparkCore和SparkSQL

四,求最大值最小值

问题:给定一组数,找出其中的最大值和最小值。

怎么解析SparkCore和SparkSQL

怎么解析SparkCore和SparkSQL

怎么解析SparkCore和SparkSQL

五,排序并添加序号

问题:给定一组数,对其从小到大排序,并添加从0开始的序号。

怎么解析SparkCore和SparkSQL


怎么解析SparkCore和SparkSQL

怎么解析SparkCore和SparkSQL

怎么解析SparkCore和SparkSQL

怎么解析SparkCore和SparkSQL

怎么解析SparkCore和SparkSQL

六,二次排序

问题:给定学生的成绩和年龄等信息,根据学生的成绩从大到小排序,如果成绩相等,根据年龄从大到小排序。

怎么解析SparkCore和SparkSQL

怎么解析SparkCore和SparkSQL

怎么解析SparkCore和SparkSQL

七,连接操作

问题:给定班级信息表和学生成绩表,对其进行连接操作,找出班级平均分在75分以上的班级。

怎么解析SparkCore和SparkSQL

怎么解析SparkCore和SparkSQL

怎么解析SparkCore和SparkSQL

关于怎么解析SparkCore和Sparksql分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐