基于Docker编译Hadoop

2016-07-06 00:56:00

摘要: 将编译Hadoop所需要的依赖软件安装到Docker镜像中，然后在Docker容器中编译Hadoop，可以提高编译效率，同时避免污染主机。编译其他软件时，也可以参考这篇博客的方法。

GitHub地址:

kiwenlau/compile-hadoop

在前一篇博客中，我介绍了64位Ubuntu中编译Hadoop的步骤。这篇博客将介绍基于Docker编译Hadoop的方法。

一. 编译步骤

1. 下载Docker镜像

sudo docker pull kiwenlau/compile-hadoop

或者自行构建Docker镜像

sudo docker build -t kiwenlau/compile-hadoop .

2. 下载并解压Hadoop源文件

export VERSION=2.7.2wget http://archive.apache.org/dist/hadoop/core/hadoop-$VERSION/hadoop-$VERSION-src.tar.gztar -xzvf hadoop-$VERSION-src.tar.gz

3. 运行Docker容器，在容器中编译Hadoop

sudo docker run -v $(pwd)/hadoop-$VERSION-src:/hadoop-$VERSION-src kiwenlau/compile-hadoop /root/compile.sh $VERSION

这一步比较耗时，大概需要15~30分钟。

正确执行的结果如下:

[INFO] BUILD SUCCESS[INFO] ------------------------------------------------------------------------[INFO] Total time: 23:46.056s[INFO] Finished at: Tue May 31 16:40:53 UTC 2016[INFO] Final Memory: 210M/915M[INFO] ------------------------------------------------------------------------comile hadoop 2.7.2 success!

编译好的二进制文件包位于

hadoop-2.7.2-src/hadoop-dist/target/hadoop-2.7.2.tar.gz

编译其他版本的Hadoop的步骤一致，仅需改变VERSION的值。

可以使用wget命令直接下载GitHub上的Hadoop二进制包:

wget https://github.com/kiwenlau/compile-hadoop/releases/download/$VERSION/hadoop-VERSION.tar.gz

二. 方法总结

编译其他软件时，也可以参考本文介绍的方法，具体细节可以参考源码kiwenlau/compile-hadoop

1. 构建编译所需的Docker镜像

编译软件往往需要安装很多依赖，而编译不同的软件有时需要不同版本的依赖，如果直接在主机上安装这些依赖会污染主机，而且也不易重复。

2. 下载软件源码

源码不放在Docker镜像里面，可以方便编译不同版本的软件，也可以提高构建Docker镜像的效率。

3. 运行Docker容器编译软件

软件源码以数据卷(volume)的形式挂载的容器内，编译所得的可执行文件也将位于数据卷内。

版权声明
转载时请注明作者KiwenLau以及本文地址：
http://kiwenlau.com/2016/06/05/160605-compile-hadoop-docker/

关键字：docker, hadoop, 编译, kiwenlau

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符，请点击举报进行投诉反馈！

标签：业界 docker hadoop 编译 kiwenlau

上一篇 > Percona XtraBackup 增量备份
下一篇 > 使用Prometheus监控etcd

Docker在Win10下的安装和配置

docker从入门到精通-入门篇PDF高清版免费下载

快速掌握dockerfile

如何打造100亿SDK累计覆盖量的大数据系统

Radio Dream流媒体直播平台基于Docker的应用

谈谈Pod在微服务中的运用

sonarqube的docker试用

把好最后一道关，Docker容器测试全探索

1.Hello world in a container

高质量 Node.js 微服务的编写和部署

云的难处——我们为什么需要 CloudEngine？

数人云CTO解读Docker 1.12和金融业容器化

在国内 docker build 的正确姿势

Mesos大神Tim实录分享 | 解读Mesos 1.0 + 更长久的Mesos Containerier

Docker commands和Dockerfile

我也谈谈微服务

Docker 和 Node.js 最佳实践

docker入门概览

第一时间 | 数人云总架构师解读Mesos1.0.0

OneOps: 自动化运维开发的管理平台

Kubernetes成为世界500强数字化转型基础的原因（以及云基础设施管理平台一览表）

记一次网络问题的排查

make工程描述编写之选择性编译

Docker和容器云落地一年后的反思

代码篇 | Docker1.12+Swarm构建动态微服务应用

make编译配置过程详解

应用容器env化实战

Docker Swarm新版本发布对Kubernetes的意义

视频笔记：Docker 特性及其相关工具 - Tom Verelst

如何快速构建一个简单的程序

利用make运行和调试程序

Docker Swarm学习笔记

基于Docker编译Hadoop

一. 编译步骤

二. 方法总结

相关文章