我开始使用Windows 7计算机,并build立了一个which I run using VirtualBox的Ubuntu Linux虚拟机。 The Cloudera Manager Free Edition version 4已经执行,我一直在使用localhost:7180的提示。
当提示问我“为CDH群集安装指定主机”时,我现在停滞不前。 我可以在Linux虚拟机中单独安装所有的Hadoop组件吗?
请帮助我指出我应该指定主持人的正确方向。
线程“main”中的exceptionjava.lang.NoClassDefFoundError:org / apache / hadoop / util / PlatformName
典型的Hadoop设置远程作业提交
使用python在JSON中查找重复项
Apache Pig:使用hadoop fs -text加载显示正常的文件
在公司云上使用Cloudera Manager设置Hadoop
Hadoop安装目录
你可以指定你的机器的主机名。 它只会在你的机器上安装所有的东西。
是的,你可以单独在linux虚拟机上运行cdh。 你可以使用“独立”或“伪分布”模式。 恕我直言,这样做的最有效的方法是使用“伪分布式”模式。
在这种情况下,有多个Java虚拟机(JVM)正在运行,因此它们被模拟为具有多个节点(每个线程被模拟为群集节点)的群集。
Cloudera记录了如何将其部署为“伪分布”:
https://www.cloudera.com/documentation/enterprise/5-6-x/topics/cdh_qs_cdh5_pseudo.html
注意:3种部署cdh的方法:
独立:单独使用一台机器,具有独特的jvm
伪分布:单独使用一台机器,但是几个jvm,如此模拟成一个集群
分布式:使用一个集群,所以有几个不同目的的节点(worker,namenode等)。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。