微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

【2020/1/18】寒假自学——学习进度报告3

  紧接上一次。


  这次是对于spark安装的总结。

  首先便是下载spark。

 

  从官网上可以找到用户提供Hadoop环境的安装包,另外值得一提的是用户也可以无需自己安装hadoop而是选择原装包括了hadoop的安装包。

 

  放入虚拟机之后解压缩,修改权限,之后就可以开始配置了。

 

   配置文件需要配置slaves(用于分布式配置,我只填入master的地址,所以也是伪分布吧)和spark-env.sh

  slaves文件设置Worker节点而spark-env.sh需要填入的内容为:

export SPARK_disT_CLAsspATH=$(/usr/local/hadoop/bin/hadoop classpath)
export HADOOP_CONF_DIR=/usr/local/hadoop/etc/hadoop # hadoop配置目录
export SPARK_MASTER_IP=192.168.1.100 # 根据自己主机地址修改

 

 

   完成后启动hadoop和spark即可。

 

   之后可以在虚拟机外部访问。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐