Ubuntu14.04安装Hadoop2.5.2(伪分布模式)

hadoop也可以运行在一个伪分布模式，每个hadoop守护进程运行在一个单独的java程序的一个节点。伪分布模式需要在单机模式基础上进行配置。在/software/hadoop/etc/hadoop/ 目录下 core-site.xml,hdfs-site.xml,mapred-site.xml,yarn-site.xml等文件。下面
hadoop也可以运行在一个伪分布模式，每个hadoop守护进程运行在一个单独的java程序的一个节点。
伪分布模式需要在单机模式基础上进行配置。
在/software/hadoop/etc/hadoop/ 目录下
core-site.xml,hdfs-site.xml,mapred-site.xml,yarn-site.xml等文件。
下面对以上文件进行配置。
一、etc/hadoop/core-site.xml
包含了hadoop启动时的配置信息。
configuration> property> name>fs.defaultfsname> value>hdfs://localhost:9000value> property>configuration>
二、etc/hadoop/hdfs-site.xml
用来配置集群中每台主机都可用，指定主机上作为namenode和datanode的目录。
configuration> property> name>dfs.replicationname> value>1value> property>configuration>
三、etc/hadoop/mapred-site.xml
默认情况下，/usr/local/hadoop/etc/hadoop/文件夹下有mapred.xml.template文件，我们要复制该文件，并命名为mapred.xml，该文件用于指定mapreduce使用的框架
configuration> property> name>mapreduce.framework.namename> value>yarnvalue> property>configuration>
四、etc/hadoop/yarn-site.xml
包含了mapreduce启动时的配置信息。
configuration> property> name>yarn.nodemanager.aux-servicesname> value>mapreduce_shufflevalue> property>configuration>
五、格式化hdfs
hdfs namenode -format
只需要执行一次即可，如果在hadoop已经使用后再次执行，会清除掉hdfs上的所有数据。
六、启动hadoop
经过上文所描述配置和操作后，下面就可以启动这个单节点的集群
执行启动命令：
sbin/start-dfs.sh
执行该命令时，如果有yes /no提示，输入yes，回车即可。
接下来，执行：
sbin/start-yarn.sh
执行完这两个命令后，hadoop会启动并运行。
执行 jps命令，会看到hadoop相关的进程。
浏览器打开 http://localhost:50070/，会看到hdfs管理页面。
浏览器打开 http://localhost:8088，会看到hadoop进程管理页面。
七、wordcount验证
dfs上创建input目录
bin/hadoop fs -mkdir -p input
把hadoop目录下的readme.txt拷贝到dfs新建的input里
hadoop fs -copyfromlocal readme.txt input
运行wordcount
hadoop jar share/hadoop/mapreduce/sources/hadoop-mapreduce-examples-2.5.2-sources.jar org.apache.hadoop.examples.wordcount input output
执行过程：
运行完毕后，查看单词统计结果
hadoop fs -cat output/*

Ubuntu14.04安装Hadoop2.5.2(伪分布模式)

推荐信息