为了高效地在本地环境中测试和开发Hadoop应用,利用VMware虚拟机来部署Hadoop集群无疑是一个明智的选择
本文将详细介绍如何在VMware上安装和配置Hadoop集群,确保每一步都清晰明了,帮助读者顺利完成部署
一、准备工作 在开始安装之前,确保你已经下载并安装了最新版本的VMware Workstation或VMware Player
此外,你还需要下载CentOS 7的64位ISO镜像文件,这是Hadoop官方推荐的操作系统之一
以下是详细的下载链接和准备工作步骤: 1.下载VMware: - 访问VMware官方网站,下载并安装最新版本的VMware Workstation或VMware Player
2.下载CentOS 7: - 访问【CentOS官网】(https://www.centos.org/),下载CentOS 7的64位版本
建议选择官方源或者可靠的镜像站点,如阿里云
二、创建和配置虚拟机 1.创建虚拟机: - 打开VMware,点击“新建虚拟机”
- 选择“典型(推荐)”安装类型,点击“下一步”
- 选择“稍后安装操作系统”,点击“下一步”
- 在客户机操作系统中选择“Linux”,版本选择“CentOS 7 64位”
- 为虚拟机命名(例如c0),并选择存储位置
- 指定磁盘容量,一般选择默认20GB
- 点击“完成”创建虚拟机
2.配置虚拟机硬件: - 选择刚刚创建的虚拟机,点击“编辑虚拟机设置”
- 移除USB控制器、声卡和打印机,以避免克隆时产生冲突
- 在CD/DVD驱动器设置中,选择“使用ISO映像文件”,并指定下载的CentOS 7 ISO文件位置
3.安装CentOS 7: - 开启虚拟机,进入CentOS 7安装界面
- 选择中文安装,设置时区为中国(上海)
- 在软件选择中,选择“GNOME桌面”
- 设置root密码(建议简单设置为123456,方便后续操作)
- 完成配置后,重启虚拟机,接受许可协议
4.网络配置: - 将虚拟机网络适配器设置为NAT模式
- 在VMware中,依次点击“编辑”->“虚拟网络编辑器”,选择NAT模式,并记住网关地址(例如192.168.157.2)
- 修改网络配置,进入root模式,编辑`/etc/sysconfig/network-scripts/ifcfg-ensXXX`文件(文件名可能因虚拟机而异,例如`ifcfg-ens33`)
-将`BOOTPROTO`设置为`static`,并添加以下静态IP配置: ``` IPADDR=192.168.157.11 PREFIXO=24 NETMASK=255.255.255.0 GATEWAY=192.168.157.2 DNS1=114.114.114.114 DNS2=8.8.8.8 ``` - 重启网络服务:`systemctl restartnetwork`
5.修改主机名: -使用`hostname`命令查看当前主机名,并通过`vim /etc/hostname`修改为主机名(例如c0)
- 重启终端使修改生效
6.克隆虚拟机: - 选择已安装的虚拟机(c0),点击“克隆”
- 选择“完整克隆”,并命名克隆的虚拟机(例如c1、c2、c3)
- 对每台克隆的虚拟机重复上述的静态IP配置和主机名修改步骤,确保每台虚拟机都有唯一的IP地址和主机名
三、设置hosts文件和SSH免密码登录 1.设置hosts文件: - 在每台虚拟机上,编辑`/etc/hosts`文件,添加所有虚拟机的IP地址和主机名映射
例如: ``` 192.168.157.11 c0 192.168.157.12 c1 192.168.157.13 c2 192.168.157.14 c3 ``` 2.配置SSH免密码登录: - 在每台虚拟机上生成SSH密钥:`ssh-keygen`,一路按回车直到完成
- 将生成的公钥复制到其他所有虚拟机
例如,在c0上执行: ``` ssh-copy-id c0 ssh-copy-id c1 ssh-copy-id c2 ssh-copy-id c3 ``` - 对其他虚拟机重复上述步骤,确保每台虚拟机都能免密码登录到其他所有虚拟机
四、安装Hadoop 1.创建安装目录并下载Hadoop: - 在主节点(例如c0)上,创建Hadoop安装目录:`mkdir /usr/local/hadoop`
- 下载Hadoop二进制文件,并将其解压到安装目录
例如,从Apache Hadoop官网下载`hadoop-x.y.z.tar.gz`,然后执行: ``` tar -xzvf hadoop-x.y.z.tar.gz -C /usr/local/hadoop --strip-components=1 ``` 2.设置环境变量: -编辑`/etc/profile`文件,添加以下Hadoop环境变量: ``` export HADOOP_HOME=/usr/local/hadoop export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin ``` - 使配置生效:`source /etc/profile`
3.配置Hadoop: - 编辑Hadoop核心配置文件`hadoop-env.sh`,设置`JAVA_HOME`为Oracle JDK的安装路径
-编辑`core-site.xml`,配置Hadoop的文件系统URI和临时目录:
```xml
- 启动Hadoop守护进程: ``` start-dfs.sh start-yarn.sh ``` - 验证Hadoop是否启动成功:访问`http://c0:50070`(HDFS管理界面)和`http://c0:8088`(YARN管理界面)
五、常见问题及解决方案 1.虚拟机无法连接到网络: - 检查NAT模式配置是否正确,确保网关和DNS设置无误
- 重启NetworkManager服务:`service NetworkManager restart`
2.SSH免密码登录失败: -检查`~/.ssh/authorized_keys`文件权限,确保只有所有者有写权限
- 清除`~/.ssh/known_hosts`文件中的旧条目,重新尝试SSH连接
3.Hadoop启动失败: - 检查日志文件,通常位于`/