频道导航

hadoop伪分布式之配置yarn并运行MR程序（WordCount）

2020-12-05 Hadoop 前端之家

前端之家收集整理的这篇文章主要介绍了hadoop伪分布式之配置yarn并运行MR程序（WordCount），前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

1、配置集群

（1）在yarn-env.sh中配置JAVA_HOME

export JAVA_HOME=/opt/module/jdk1.8.0_11

（2）在yarn-site.xml中配置

<!--Reducer获取数据的方式-->
<property>
    name>yarn.nodemanager.aux-services</value>mapreduce_shuffle>
指定yarn的ResourceManager的地址>yarn.resourcemanager.hostname>hadoop01>

（3）配置mapred-env.sh

export JAVA_HOME=/opt/module/jdk1.8.0_11

（4）将mapred-site.xml.template重命名为mapred-site.xml

mv mapred-site.xml.template mapred-site.xml

并配置：

指定MR运行在yarn上>mapreduce.framework.name>yarn>

二、启动集群

确保NameNode和Datanode已经启动，用jps查看，若没启动，则进行启动（在hadoop-2.9.2目录下）

sbin/hadoop-daemon.sh start namenode

sbin/hadoop-daemon.sh start datanode

（1）启动ResourceManager

sbin/yarn-daemon.sh start resourcemanager

（2）启动NodeManager

sbin/yarn-daemon.sh start nodemanager

systemctl status firewalld.service查看防火墙状态

systemctl stop firewalld.service 关闭运行的防火墙

（3）查看集群

（4）执行WordCount

之前操作参考：https://www.cnblogs.com/xiximayou/p/12389363.html

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.9.2.jar wordcount /user/gong/input /user/gong/output

然后就可以看到：

在控制台：

在50070端口：

删除应用：sh yarn application -kill jobId

上一篇：hadoop伪分布式之配置历史服务器下一篇：hadoop伪分布式之配置日志聚集

猜你在找的Hadoop相关文章

不可不知的资源管理调度器Hadoop Yarn

Yarn（Yet Another Resource Negotiator）是一个资源调度平台，负责为运算程序如Spark、Ma...

作者：前端之家时间：2020-12-11

详解MapReduce（Spark和MapReduce对比铺垫篇）

MapReduce是Hadoop核心三剑客之一，设计思想来源于谷歌三篇论文之一的《分布式计算模型》。...

作者：前端之家时间：2020-12-11

关于HDFS应知应会的N个问题 | 技术点

HDFS（Hadoop Distributed File System）分布式文件存储系统，主要为各类分布式计算框架如...

作者：前端之家时间：2020-12-11

必须掌握的分布式文件存储系统—HDFS

HDFS（Hadoop Distributed File System）分布式文件存储系统，主要为各类分布式计算框架如...

作者：前端之家时间：2020-12-11

Hadoop调优 | NameNode主备宕机引发的思考

作者：前端之家时间：2020-12-11

如何有效恢复误删的HDFS文件

HDFS是大数据领域比较知名的分布式存储系统，作为大数据相关从业人员，每天处理HDFS上的文...

作者：前端之家时间：2020-12-11

hadoop之Name node is in safe mode

关闭虚拟机之后重启hadoop，想要用删除之前在hdfs运行的output文件，显示： hadoop之Name ...

作者：前端之家时间：2020-12-05

linux版本的jdk1.8+hadoop2.9.2下载地址

hadoop：链接：https://pan.baidu.com/s/14AhhPYP8933tn-EfSX-i8Q 提取码：e90m...

作者：前端之家时间：2020-12-05

hadoop之运行官方实例二--WordCount

1、在hadoop-2.9.2目录下新建一个wcinput：mkdir wcinput 2、在wcinput下新建一个文件：to...

作者：前端之家时间：2020-12-05

hadoop完全分布式之rsync

rsync与scp的区别？ rsync主要用于备份和镜像，具有速度快、避免复制相同内容和支持符号链...

作者：前端之家时间：2020-12-05

编程分类

算法设计模式多媒体技术正则表达式 Elasticsearch Flink Hadoop IDE

最新文章