CDH
因为Ambari的Tez无法解决,退坑了。
内容参考以下博客
CDH及其他资源下载
一、前置任务
创建docker自定义网络
下载上述资源
在下载后CDH文件夹中,Dockerfile同级目录执行以下命令来创建基础系统镜像
二、构建主节点
2.1 初始化环境
启动容器
拷贝hadoop_CDH资源文件夹到主节点
进入主节点
设置root密码
安装常用证书,然后换清华源,升级并安装基础软件包
2.2 配置中文环境
2.3 设置时间同步
更改为以下四个时钟服务器
调整时区
启动ntp服务
2.4 搭建本地yum源
2.5安装jdk
2.6安装配置MySQL数据库
2.7数据库授权
获取MySQL初始密码
使用密码登录进入mysql
登陆后执行
2.8配置mysql jdbc驱动
2.9安装Cloudera Manager
2.10配置parcel库
2.11初始化scm库
2.12启动cloudera-server服务
三、配置从节点
以下为worker容器的准备方式,若为多个时,重复执行以下步骤,创建多个worker节点。
3.1创建多个worker容器
以此类推
3.2配置免密
进入所有从节点,配置root密码和主节点一样。
进入主节点,/etc/hosts添加如下
按照下面指示创建脚本文件
脚本修改config.sh后把/etc/hosts和/root/Shell发送给所有节点一份
配置主节点到所有节点的免密
创建host.txt文件,写入从节点名称
3.3装基本工具
给所有从节点安装常用证书
创建tmp.sh,写入以下内容
让从节点都执行这个本地(主节点)脚本,来更新清华源
安装基础软件包
3.4配置中文环境变量
将以下内容写入tmp.sh
3.5配置NTP时间同步服务
更改四个时钟服务器
调整时区
启动ntp服务,将以下写入sh
3.6配置MySQL JDBC
写入sh后pssh
四、CM管理平台创建CDH集群
4.1登陆CM管理平台
账号密码:admin/admin
4.2欢迎页
同意协议并选择免费套餐
4.3集群安装
填集群名字
主机名称填 172.10.0.[2-5],端口默认22,然后点击搜索,继续

Jdk安装

用户为root,密码为容器root用户的登录密码。
等待安装agent服务。
等待Parcel 下载并安装。
检查集群,如果出现warn或error,根据提示修复或完善。
4.4集群设置

自定义服务

各个组件具体安装在哪,仅供参考

数据库选择。数据库,用户名,密码,在2.7的脚本里看。
Datanode-> /dfs/datanode
Namenode-> /dfs/namenode
HDFS检查点-> /dfs/checkpoint
NodeManager 本地目录-> /dfs/nodemanager
首次运行,并检查所有服务
Last updated

