微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Spark的内存管理

spark在执行应用程序时,Spark集群会启动Driver和Executor两种JVM进程

Driver :

创建SparkContext上下文,提交任务,task的分发

Executor:

负责task的计算任务,并将结果返回给Driver,同时需要为需要持久化的RDD提供储存

Driver端的内存管理比较简单,这里内存管理针对是Executor端的内存管理

spark1.6之前使用的是静态内存管理,1.6之后使用的是动态内存管理

spark.memory.useLegacyMode 设置为 true (认为 false)使用静态内存管理。

静态内存管理图

1556344984577

统一内存管理图

在这里插入图片描述

reduce中OOM的处理

1.减少每次拉取的数据量

2.提高shuffle聚合的内存比例

3.提高Executor的总内存

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐