ubuntu上安装 hadoop

工具及软件

1. ubuntu 12.04 (安装在虚拟机里这里用的是vmware)

2. hadoop 2.6.5 点我下载

在进行本章节前，首先确认已经完成以下2步骤

1. ubuntu 上安装ssh 服务

2. ubuntu 上安装JDK

接着进行ubuntu上安装 hadoop

首先下载 hadoop 点我下载我这里用的是 2.6.5版本（2.x）

网络适配器设置成 host only (仅主机)模式

打开 vmware 安装路径下的 vmnetcfg.exe ，设置 VMnet1 的子网端为8，如下 192.168.8.100 这个是windows 系统的ip.

可以理解此计算机上安装了虚拟网卡，地址值 192.168.8.100,那之后我们可以通过虚拟机可以和外部windows通信

进入虚拟机，设置ubuntu机器的IP地址，这里我们就直接UI界面手动设置固定IP，当然也可以通过命令设置

我们设置了地址是8 网段，和宿主机器网段一样地址:88

在用户名下创建我的工作目录如src

root@ubuntu:/home/dragon# mkdir src

通过 FileZilla上传下载好的 hadoop2.6.5.tar.gz 文件

为了方便工作，我们在跟目录创建自己的目录如创建finder

#mkdir /finder

#mkdir /finder/hadoop

解压hadoop到 /finder/hadoop目录

#tar -zxvf /home/dragon/src/hadoop-2.6.5.tar.gz -C /finder/hadoop

设置环境变量

#nano /etc/profile

export HADOOP_HOME="/finder/hadoop/hadoop-2.6.5"

export JAVA_HOME="/usr/java/jdk1.7.0_76"
export PATH="$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin"
export JRE_HOME="$JAVA_HOME/jre"
export CLASSPATH=".:$JAVA_HOME/lib:$JRE_HOME/lib"

修改hadoop相关配置，共需要修改 5个文件

hadoop-env.sh、 core-site.xml、 hdfs-site.xml、yarn.site.xml、 mapred-site.xml

1. 打开 hadoop-env.sh 设置JDK路径

# nano hadoop-env.sh
# The java implementation to use.
export JAVA_HOME=/usr/java/jdk1.7.0_76

2. 编辑 core-site.xml

# nano core-site.xml
 
<configuration>
        <property>
                <name>fs.default.name</name> <!-- 指定HDFS 节点（namenode）的通信地址 -->
                <value>hdfs://192.168.8.88:9000</value>
        </property>
    <property>
                <name>hadoop.tmp.dir</name> <!-- 指定hadoop运行时产生文件的存储路径,非正常意义上的临时文件 -->
                <value>/finder/hadoop/tmp</value>
        </property>


</configuration>

3. 编辑 hdfs-site.xml

 #nano  hdfs-site.xml

<configuration>
   <property>
        <name>dfs.replication</name> <!-- 设置hdfs副本数量  这里我们只有一台机器，那肯定副本就写1个-->
        <value>1</value>
   </property>
</configuration>

4. 编辑 mapred-site.xml

如果不存在mapred-site.xml ：mapred-site.xml.template 需要重命名： mv mapred-site.xml.template mapred-site.xml

# nano mapred-site.xml

   <configuration>
   <property>
       <name>mapreduce.framework.name</name><!-- 通知框架MR使用YARN -->
       <value>yarn</value>
    </property>

</configuration>

5. 编辑 yarn-site.xml

# nano yarn-site.xml

<configuration>


<!-- Site specific YARN configuration properties -->


   <property>
       <name>yarn.nodemanager.aux-services</name><!-- reducer取数据的方式是mapreduce_shuffle -->
       <value>mapreduce_shuffle</value>
    </property><property>
   <name>yarn.resourcemanager.webapp.address</name> <!-- 资源管理WEB地址 最好设置，不设置可能 默认 8088端口不会启动 -->
   <value>192.168.8.88:8088</value>
 </property>
   <property>
       <name>yarn.resourcemanager.hostname</name>
       <value>ubuntu</value>
   </property>
</configuration>

文件配置好后，下面就可以运行了

运行前首先需要格式化 HDFS文件系统

进入 bin目录

执行

hdfs namenode -format

执行成功后，可以看到 hadoop.dir.tmp 指向的目录被初始化

现在可以启动hadoop了

进入 sbin目录cd /finder/hadoop/hadoop-2.6.5/sbin

执行：

./start-all.sh

This script is Deprecated. Instead use start-dfs.sh and start-yarn.sh

当然以上的启动命令过时了，应该分别启动这2个命令 ./start-yarn.sh ./start-dfs.sh

启动的时候，需要输入密码，如果配置ssh 免登陆就不需要设置密码了

由此要注意 ssh的端口通过hadoop在启动的时候也需要连接的，如果端口修改了，那么hadoop指向的 ssh-server的端口也需要修改

查看是否启动成功，执行jps (注意：如果 jps找不到) 查看环境变量有没有设置或者更新 source /etc/profile

如果还是不行，请查看JDK安装文章，重新选择JDK

root@ubuntu:/finder/hadoop/hadoop-2.6.5/sbin# which jps
/usr/java/jdk1.7.0_76/bin/jps

可以查看jps命令原来是 jdk下面的命令

jps查看运行的进程

root@ubuntu:/finder/hadoop/hadoop-2.6.5/sbin# jps
6827 ResourceManager  
6658 SecondaryNameNode
6389 Datanode
7039 NodeManager
6188 NameNode

这样就搞定 hadoop环境部署,并且搭建的本地的为分布式环境

hadoop自带的web控制台GUI查看

1. 资源管理 http://localhost:8088

2. 节点管理: http://localhost:50070

测试上传下载文件。命令和linux命令差不多只是多了个hadoop fs

我们把 hadoop-2.6.5.tar.gz上传到 hdfs 文件系统使用 put命令

下载使用 get

root@ubuntu:/finder# hadoop fs -put /home/dragon/src/hadoop-2.6.5.tar.gz hdfs://192.168.8.88:9000/hadoop
root@ubuntu:/finder# hadoop fs -ls hdfs://192.168.8.88:9000
ls: `hdfs://192.168.8.88:9000': No such file or directory
root@ubuntu:/finder# hadoop fs -ls hdfs://192.168.8.88:9000/
Found 5 items
-rw-r--r--   1 root supergroup  199635269 2017-02-21 12:15 hdfs://192.168.8.88:9000/hadoop
-rw-r--r--   1 root supergroup  142249690 2017-02-20 20:53 hdfs://192.168.8.88:9000/jdk
drwx------   - root supergroup          0 2017-02-20 21:17 hdfs://192.168.8.88:9000/tmp
-rw-r--r--   1 root supergroup         40 2017-02-20 21:15 hdfs://192.168.8.88:9000/wc
drwxr-xr-x   - root supergroup          0 2017-02-20 21:20 hdfs://192.168.8.88:9000/wcout
root@ubuntu:/finder# hadoop fs -get hdfs://192.168.8.88:9000/hadoop /finder/hadoop-x
root@ubuntu:/finder# ls /finder
hadoop  hadoop-x

以上我们演示了上传、下载并且查看文件

现在我们可以在节点管理UI中查看

我们可以UI查看管理和下载，以及可以看到分了哪些block（区块）

ubuntu上安装 hadoop

hadoop自带的web控制台GUI查看

猜你在找的Ubuntu相关文章