本指南詳細介紹如何在Debian系統上搭建hadoop集成開發環境。 以下步驟將引導您完成整個過程:
第一步:安裝JDK
首先,需要在Debian系統上安裝Java開發工具包(JDK)。執行以下命令:
sudo apt-get update sudo apt-get install -y wget wget -O - https://packages.adoptium.net/artifactory/api/gpg/key/public | sudo tee /etc/apt/keyrings/adoptium.asc echo "deb [signed-by=/etc/apt/keyrings/adoptium.asc] https://mirrors.tuna.tsinghua.edu.cn/Adoptium/deb $(lsb_release -rs) main" | sudo tee /etc/apt/sources.list.d/adoptium.list sudo apt-get update sudo apt-get install -y temurin-8-jdk
第二步:配置Java環境變量
編輯.bashrc文件,添加以下環境變量:
export JAVA_HOME=/usr/lib/jvm/temurin-8-jdk-amd64 export PATH=$JAVA_HOME/bin:$PATH
運行source ~/.bashrc使配置生效。
第三步:下載并解壓Hadoop
創建目錄并下載Hadoop安裝包:
mkdir -p /root/packages wget -P /root/packages https://dlcdn.apache.org/hadoop/common/hadoop-3.3.6/hadoop-3.3.6-aarch64.tar.gz
解壓到/usr/local目錄:
tar -zxvf /root/packages/hadoop-3.3.6-aarch64.tar.gz -C /usr/local
第四步:配置Hadoop環境變量
編輯$HADOOP_HOME/etc/hadoop/hadoop-env.sh文件,設置JAVA_HOME:
export JAVA_HOME=/usr/lib/jvm/temurin-8-jdk-amd64 export HADOOP_HOME=/usr/local/hadoop-3.3.6 export PATH=$HADOOP_HOME/bin:$PATH
第五步:配置Hadoop核心配置文件
編輯$HADOOP_HOME/etc/hadoop/core-site.xml、hdfs-site.xml和mapred-site.xml文件,配置HDFS和mapreduce參數。 例如,在core-site.xml中配置fs.defaultFS:
<configuration> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> </configuration>
(請根據您的實際需求調整其他配置文件)
第六步:格式化NameNode
在Hadoop的主目錄下執行以下命令格式化NameNode:
hdfs namenode -format
第七步:啟動Hadoop集群
啟動Hadoop集群:
start-dfs.sh start-yarn.sh
第八步:驗證安裝
在瀏覽器中訪問http://localhost:9000驗證Hadoop是否成功安裝并運行。
本指南提供了一個基本的Hadoop在Debian上的搭建步驟。 您可能需要根據實際情況進行進一步的配置和優化。