微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

Spark的四种部署方式概括

1.Local模式

Local模式就是运行在一台计算机上的模式,通常用于在本机上测试,当不设置master参数的值时,认此模式,具体有以下几种设置master的方式。

  1. local:所有计算都运行在一个线程当中,没有任何并行计算。
  2. local[n]:指定使用n个线程来运行计算。
  3. local[*]:按照cpu的最多核数来设置线程数。

2.Standalone模式

设置master参数的值为spark://host:port,即开启Standalone模式,将构建一个基于Master/Slave的资源调度集群,Spark任务提交给Master运行。

3.Yarn模式

Spark客户端直接连接Yarn,不需要格外构建Spark集群,有yarn-client和yarn-cluster两种模式,主要区别在于Driver程序的运行节点不同(yarn-client的Driver程序运行在客户端,适用于交互、调试,而yarn-cluster的Driver程序运行在由ResourceManager启动的ApplicationMaster中,适用于生产环境)。master参数设置为yarn,deploy-mode参数为client或者cluster。

4.Mesos模式

Spark客户端直接连接Mesos,不需要额外构建Spark集群。

在Spark的后续版本中,已经支持连接到Kubernetes集群。

这四种模式的差别在于资源管理者是谁。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐