微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

对于单个CDHHadoop群集安装,我应该使用哪个主机?

我开始使用Windows 7计算机,并build立了一个which I run using VirtualBox的Ubuntu Linux虚拟机。 The Cloudera Manager Free Edition version 4已经执行,我一直在使用localhost:7180的提示

提示问我“为CDH群集安装指定主机”时,我现在停滞不前。 我可以在Linux虚拟机中单独安装所有的Hadoop组件吗?

请帮助我指出我应该指定主持人的正确方向。

线程“main”中的exceptionjava.lang.NoClassDefFoundError:org / apache / hadoop / util / PlatformName

Cloudera:在HDFS例外中上传文件

典型的Hadoop设置远程作业提交

使用python在JSON中查找重复项

Apache Pig:使用hadoop fs -text加载显示正常的文件

在公司云上使用Cloudera Manager设置Hadoop

Hadoop安装目录

你可以指定你的机器的主机名。 它只会在你的机器上安装所有的东西。

是的,你可以单独在linux虚拟机上运行cdh。 你可以使用“独立”或“伪分布”模式。 恕我直言,这样做的最有效的方法是使用“伪分布式”模式。

在这种情况下,有多个Java虚拟机(JVM)正在运行,因此它们被模拟为具有多个节点(每个线程被模拟为群集节点)的群集。

Cloudera记录了如何将其部署为“伪分布”:

https://www.cloudera.com/documentation/enterprise/5-6-x/topics/cdh_qs_cdh5_pseudo.html

注意:3种部署cdh的方法

独立:单独使用一台机器,具有独特的jvm

伪分布:单独使用一台机器,但是几个jvm,如此模拟成一个集群

分布式:使用一个集群,所以有几个不同目的的节点(worker,namenode等)。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐