溫馨提示×

Ubuntu HDFS配置后如何測試

小樊
36
2025-10-14 12:28:17
欄目: 智能運維

Ubuntu HDFS配置后測試步驟

1. 基礎服務進程驗證

配置完成后,首先需確認HDFS核心進程是否正常啟動。在終端執行jps命令,若輸出中包含NameNode(主節點)、DataNode(數據節點)進程(偽分布式模式下無SecondaryNameNode,集群模式下需包含),則說明HDFS服務啟動成功。

2. Web UI界面檢查

通過瀏覽器訪問HDFS的Web管理界面,直觀查看集群狀態:

  • HDFS狀態頁:http://localhost:9870(Hadoop 3.x版本)或http://localhost:50070(Hadoop 2.x版本),確認“Live Nodes”顯示當前DataNode節點在線(偽分布式模式為1個)。
  • YARN資源頁(若配置了YARN):http://localhost:8088,檢查“Active Nodes”顯示NodeManager節點正常。

3. HDFS基本文件操作測試

使用HDFS命令行工具執行常見文件操作,驗證文件系統的讀寫功能:

  • 創建目錄hdfs dfs -mkdir -p /user/test-p參數遞歸創建父目錄)。
  • 上傳本地文件:將本地文件(如/etc/hosts)上傳至HDFS:hdfs dfs -put /etc/hosts /user/test/。
  • 列出目錄內容hdfs dfs -ls /user/test,確認上傳的文件存在。
  • 讀取文件內容hdfs dfs -cat /user/test/hosts,檢查文件內容是否與本地一致。
  • 下載文件hdfs dfs -get /user/test/hosts ./hosts_copy,將HDFS文件下載至本地,驗證數據完整性。
  • 刪除文件hdfs dfs -rm /user/test/hosts,清理測試文件。

4. MapReduce示例程序測試

運行Hadoop自帶的MapReduce示例程序,驗證集群的計算能力:

  • WordCount(詞頻統計)
    ① 準備測試數據:echo "Hello Hadoop World" > input.txt、echo "Hadoop is awesome" >> input.txt。
    ② 上傳數據至HDFS:hdfs dfs -mkdir -p /user/hadoop/wordcount/input、hdfs dfs -put input.txt /user/hadoop/wordcount/input/。
    ③ 執行WordCount任務:yarn jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar wordcount /user/hadoop/wordcount/input /user/hadoop/wordcount/output。
    ④ 查看結果:hdfs dfs -cat /user/hadoop/wordcount/output/part-r-00000,預期輸出單詞及出現次數(如Hadoop 2、is 2、awesome 1、World 1)。
  • Pi計算(蒙特卡洛算法)yarn jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar pi 10 100,驗證任務調度功能,預期輸出π的近似值(如3.141592653589793)。

5. 性能基準測試(可選)

使用Hadoop自帶的TestDFSIO工具評估HDFS的讀寫性能:

  • 寫入性能測試yarn jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-*.jar TestDFSIO -write -nrFiles 10 -size 1GB(生成10個1GB文件,測量寫入吞吐量)。
  • 讀取性能測試yarn jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-*.jar TestDFSIO -read -nrFiles 10 -size 1GB(讀取上述文件,測量讀取吞吐量)。
  • 結果分析:通過輸出的“Throughput”(吞吐量,單位MB/s)評估集群性能,若吞吐量符合預期(如偽分布式模式下寫入約50-100MB/s),則說明配置正常。

注意事項

  • 測試前需確保Java環境(java -version顯示Java 8或11)、SSH免密登錄(ssh localhost無需密碼)已正確配置。
  • 若測試過程中出現權限問題,可執行hdfs dfs -chmod -R 777 /user/test臨時開放目錄權限(生產環境需謹慎使用)。
  • 偽分布式模式下,SecondaryNameNode進程不會啟動,屬于正?,F象;集群模式下需確保所有節點進程正常。

0
亚洲午夜精品一区二区_中文无码日韩欧免_久久香蕉精品视频_欧美主播一区二区三区美女