Hadoop基础_hadoop教程

全栈程序员-用户IM • 2022年4月21日下午6:20 • 未分类

大家好，又见面了，我是你们的朋友全栈君。

1、安装与配置

cd /opt

wget http://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-2.7.7/hadoop-2.7.7.tar.gz

tar -zxvf hadoop-2.7.7.tar.gz

设置hadoop环境变量

export HADOOP_HOME=/opt//hadoop-2.7.7

export PATH=$PATH:$HADOOP_HOME/bin

export PATH=$PATH:$HADOOP_HOME/sbin

可以找到位置“$HADOOP_HOME/etc/hadoop”下找到所有Hadoop配置文件。为了使用Java开发Hadoop程序，必须重新设置hadoop-env.sh文件的java环境变量。

可以通过echo $JAVA_HOME获取Java位置，然后在hadoop-env.sh中修改

以下是必须编辑配置Hadoop的文件列表。

core-site.xml

core-site.xml文件中包含如读/写缓冲器用于Hadoop的实例的端口号的信息，分配给文件系统存储，用于存储所述数据存储器的限制和大小。

打开core-site.xml 并在<configuration>，</configuration>标记之间添加以下属性。

<configuration> 
  <property> 
   <name>fs.default.name </name>
   <value> hdfs://localhost:9000 </value>
  </property> 

 <property>
  <name>hadoop.tmp.dir</name>
  <value>/hadoop</value>
 </property>

  <property>
  <name>dfs.name.dir</name>
  <value>/hadoop/name</value>
 </property>
</configuration>

hdfs-site.xml

hdfs-site.xml 文件中包含如复制数据的值，NameNode路径的信息，本地文件系统的数据节点的路径。这意味着是存储Hadoop基础工具的地方。

打开这个文件，并在这个文件中的<configuration></configuration>标签之间添加以下属性。

<configuration>

   <property>
      <name>dfs.data.dir</name> 
      <value>/home/hadoop/data</value> 
   </property>
       
</configuration>

注：在上面的文件，所有的属性值是用户定义的，可以根据自己的Hadoop基础架构进行更改。

yarn-site.xml

此文件用于配置成yarn在Hadoop中。打开 yarn-site.xml文件，并在文件中的<configuration></configuration>标签之间添加以下属性。

<configuration>
 
   <property>
      <name>yarn.nodemanager.aux-services</name>
      <value>mapreduce_shuffle</value> 
   </property>
  
</configuration>

mapred-site.xml

此文件用于指定正在使用MapReduce框架。缺省情况下，包含Hadoop的模板yarn-site.xml。首先，它需要从mapred-site.xml复制。获得mapred-site.xml模板文件使用以下命令。

$ cp mapred-site.xml.template mapred-site.xml

打开mapred-site.xml文件，并在此文件中的<configuration></configuration>标签之间添加以下属性。

<configuration>
 
   <property> 
      <name>mapreduce.framework.name</name>
      <value>yarn</value>
   </property>
   
</configuration>

转载于:https://my.oschina.net/lin546/blog/3016365

发布者：全栈程序员-用户IM，转载请注明出处：https://javaforall.cn/106962.html原文链接：https://javaforall.cn

【正版授权，激活自己账号】： Jetbrains全家桶Ide使用，1年售后保障，每天仅需1毛

【官方授权正版激活】： 官方授权正版激活支持Jetbrains家族下所有IDE 使用个人JB账号...

Hadoop基础_hadoop教程

1、安装与配置

相关推荐

AArch64教程第一章

out of sync with file system

php对接亿乐社区,亿乐社区对接教程

java怎么键盘录入字符串

部门人员职位权限表设计图_职位设置

ipfs矿机挖币是骗局(ipfs挖矿用什么网络)

发表回复