fedora20安装hadoop-2.5.1

  • Post category:other

以下是详细讲解“fedora20安装hadoop-2.5.1的完整攻略”:

fedora20安装hadoop-2.5.1

Hadoop是一个开源的分布式计算平台,用于处理大规模数据集。本文将介绍在fedora20上安装hadoop-2.5.1的完整攻略,并提供两个示例说明。

安装Java

在安装Hadoop之前,我们需要先安装Java。以下是在fedora20上安装Java的命令:

sudo yum install java-1.8.0-openjdk-devel

在该命令中,我们使用yum命令安装Java。

下载Hadoop

在安装Java之后,我们需要下载Hadoop。以下是在fedora20上下载Hadoop-2.5.1的命令:

wget http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-2.5.1/hadoop-2.5.1.tar.gz

在该命令中,我们使用wget命令下载Hadoop-2.5.1。

安装Hadoop

在下载Hadoop之后,我们需要解压并安装Hadoop。以下是在fedora20上安装Hadoop-2.5.1的命令:

tar -zxvf hadoop-2.5.1.tar.gz
sudo mv hadoop-2.5.1 /usr/local/hadoop

在该命令中,我们使用tar命令解压Hadoop-2.5.1,并将其移动到/usr/local/hadoop目录下。

配置Hadoop

在安装Hadoop之后,我们需要进行一些配置。以下是在fedora20上配置Hadoop-2.5.1的命令:

sudo vi /usr/local/hadoop/etc/hadoop/hadoop-env.sh

在该命令中,我们使用vi命令编辑hadoop-env.sh文件,并添加以下内容:

export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk
export HADOOP_HOME=/usr/local/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

接下来,我们需要编辑core-site.xml文件。以下是在fedora20上编辑core-site.xml文件的命令:

sudo vi /usr/local/hadoop/etc/hadoop/core-site.xml

在该命令中,我们使用vi命令编辑core-site.xml文件,并添加以下内容:

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

接下来,我们需要编辑hdfs-site.xml文件。以下是在fedora20上编辑hdfs-site.xml文件的命令:

sudo vi /usr/local/hadoop/etc/hadoop/hdfs-site.xml

在该命令中,我们使用vi命令编辑hdfs-site.xml文件,并添加以下内容:

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>file:/usr/local/hadoop/hadoop_data/hdfs/namenode</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>file:/usr/local/hadoop/hadoop_data/hdfs/datanode</value>
    </property>
</configuration>

最后,我们需要编辑mapred-site.xml文件。以下是在fedora20上编辑mapred-site.xml文件的命令:

sudo cp /usr/local/hadoop/etc/hadoop/mapred-site.xml.template /usr/local/hadoop/etc/hadoop/mapred-site.xml
sudo vi /usr/local/hadoop/etc/hadoop/mapred-site.xml

在该命令中,我们使用cp命令复制mapred-site.xml.template文件,并使用vi命令编辑mapred-site.xml文件,并添加以下内容:

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

启动Hadoop

在完成Hadoop的配置之后,我们可以启动Hadoop。以下是在fedora20上启动Hadoop-2.5.1的命令:

sudo /usr/local/hadoop/sbin/start-all.sh

在该命令中,我们使用start-all.sh脚本启动Hadoop。

示例1:上传文件到HDFS

以下是示例代码,将本地文件上传到HDFS:

hadoop fs -put /path/to/local/file /path/to/hdfs/file

在该代码中,我们使用put命令将本地文件上传到HDFS。

示例2:运行Hadoop任务

以下是示例代码,运行Hadoop任务:

hadoop jar /usr/local/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.1.jar wordcount /path/to/input /path/to/output

在该代码中,我们使用hadoop jar命令运行Hadoop任务。

总结

本文介绍了在fedora20上安装Hadoop-2.5.1的完整攻略,并提供了两个示例说明。通过本文的介绍,读者可以更好地理解Hadoop的安装和配置,并在开发中更加灵活地使用Hadoop。