AI导航网

技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

2020寒假学习笔记08

时间：2022-09-04分类：Spark作者：编程之家原文地址

　　几天无奈之下只能暂时放弃第五个实验的第2题，开始做第三题，经过踉踉跄跄以后，对源程序进行打包时出错。

　　第三题实验内容：　　

3. 编程实现利用 DataFrame 读写 MysqL 的数据（1）在 MysqL 数据库中新建数据库 sparktest，再创建表 employee，包含下面两行数据。

（2）配置 Spark 通过 JDBC 连接数据库 MysqL，编程实现利用 DataFrame 插入如表 6-3 所示的两行数据到 MysqL 中，最后打印出 age 的最大值和 age 的总和。源代码：（1）启动并登陆MysqL 后执行如下命令：

1 create database sparktest;
2 use sparktest;
3 create table employee(id int(4),name char(20),gender char(4),age int(4));
4 insert into employee values(1,'Alice','F',22);
5 insert into employee values(2,'John','M',25);

View Code

（2）

 1 import java.util.Properties
 2 import org.apache.spark.sql.types._
 3 import org.apache.spark.sql.Row
 4 object TestMysqL
 5 {
 6     def main(args:Array[String])
 7     {
 8         val employeeRDD=spark.sparkContext.parallelize(Array("3 Mary F 26","4 Tom M 23")).map(_.split(" "))
 9         val schema=StructType(List(StructField("id",IntegerType,true),StructField("name",StringType,true),StructField("gender",StringType,true),StructField("age",IntegerType,true)))
10         val rowRDD=employeeRDD.map(p=>Row(p(0).toInt,p(1).trim,p(2).trim,p(3).toInt))
11         val employeeDF=spark.createDataFrame(rowRDD,schema)
12         val prop=new Properties()
13         prop.put("user","root")
14         prop.put("password","yr123456")
15         prop.put("driver","com.MysqL.jdbc.Driver")
16         employeeDF.write.mode("append").jdbc("jdbc:MysqL://localhost:3306/sparktest","sparktest.employee",prop)
17         val jdbcDF=spark.read.format("jdbc").option("driver","com.MysqL.jdbc.Driver").option("dbtable","employee").option("user","root").option("password","yr123456").load()
18         jdbcDF.agg("age"->"max","age"->"sum")
19     }
20 }

View Code

目前第二问仍然出错并且目前还没有办法解决，错误如下：

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 [email protected] 举报，一经查实，本站将立刻删除。

相关推荐

1_Spark Streaming 概述

1.SparkStreaming是什么？SparkStreaming是SparkCore的扩展API用来支持高吞吐、高容错的处理流式数据数据源可以是:Kafka、TCPsockets、Flume、Twitter等流式数据源处理数据:可以用SparkCore的算子map、reduce、join、...

作者：编程之家时间：2022-11-24

Spark通讯录相似度计算怎么实现

本篇内容介绍了“Spark通讯录相似度计算怎么实现”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这...

作者：编程之家时间：2022-11-11

如何进行Spark数据分析

本篇文章给大家分享的是有关如何进行Spark数据分析，小编觉得挺实用的，因此分享给大家学习，希望大家阅读完这篇文章后可以有所收获，话不多说...

作者：编程之家时间：2022-11-11

Spark Shuffle和Hadoop Shuffle有哪些区别

本篇内容主要讲解“Spark Shuffle和Hadoop Shuffle有哪些区别”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“S...

作者：编程之家时间：2022-11-12

TSDB的数据怎么利用Hadoop/spark集群做数据分析

这篇文章主要介绍“TSDB的数据怎么利用Hadoop/spark集群做数据分析”，在日常操作中，相信很多人在TSDB的数据怎么利用Hadoop/spark集群做数据分析问题上存在疑惑...

作者：编程之家时间：2022-11-12

Hadoop与Spark性能原理是什么

本篇内容介绍了“Hadoop与Spark性能原理是什么”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这

作者：编程之家时间：2022-11-12

Hadoop和Spark有什么不同

小编给大家分享一下Hadoop和Spark有什么不同，相信大部分人都还不怎么了解，因此分享这篇文章给大家参考一下，希望大家阅读完这篇文章后大有收获，下面让我们

作者：编程之家时间：2022-11-12

Hadoop和Spark的Shuffle过程有什么不同

这篇文章主要讲解了“Hadoop和Spark的Shuffle过程有什么不同”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习...

作者：编程之家时间：2022-11-12

基于CDP7.1.1的Spark3.0技术预览版本分析是怎样的

本篇文章给大家分享的是有关基于CDP7.1.1的Spark3.0技术预览版本分析是怎样的，小编觉得挺实用的，因此分享给大家学习，希望大家阅读完这篇文章后可以有所收获...

作者：编程之家时间：2022-11-12

Spark中foreachRDD、foreachPartition和foreach的区别是什么

这篇文章主要介绍“Spark中foreachRDD、foreachPartition和foreach的区别是什么”，在日常操作中，相信很多人在Spark中foreachRDD、foreachPartition和foreach的...

作者：编程之家时间：2022-11-12