在之前的数篇笔记中我们从零开始完成了 Hadoop 分布式集群的搭建。从这一篇笔记开始,我们要通过 MapReduce 计算框架的学习和实践,将集群转化为生产力。
本篇是系列的第五篇笔记。本篇笔记中我们将会继续分析学习 Mapper 数据输出的相关源代码,从而加深对相关流程的理解。
我想玩丝之歌
在之前的数篇笔记中我们从零开始完成了 Hadoop 分布式集群的搭建。从这一篇笔记开始,我们要通过 MapReduce 计算框架的学习和实践,将集群转化为生产力。
本篇是系列的第五篇笔记。本篇笔记中我们将会继续分析学习 Mapper 数据输出的相关源代码,从而加深对相关流程的理解。
在之前的数篇笔记中我们从零开始完成了 Hadoop 分布式集群的搭建。从这一篇笔记开始,我们要通过 MapReduce 计算框架的学习和实践,将集群转化为生产力。
本篇是系列的第四篇笔记。本篇笔记中我们暂时离开源代码,通过实例来加深对 MR 框架的理解和应用能力。
在之前的数篇笔记中我们从零开始完成了 Hadoop 分布式集群的搭建。从这一篇笔记开始,我们要通过 MapReduce 计算框架的学习和实践,将集群转化为生产力。
本篇是系列的第三篇笔记。本篇笔记中我们将会继续分析学习 Mapper 任务启动和数据读取的相关源代码,从而加深对相关流程的理解。
在之前的数篇笔记中我们从零开始完成了 Hadoop 分布式集群的搭建。从这一篇笔记开始,我们要通过 MapReduce 计算框架的学习和实践,将集群转化为生产力。
本篇是系列的第二篇笔记。本篇笔记中我们将会分析学习客户端作业提交相关源码,从而加深对相关流程的理解。
在之前的数篇笔记中我们从零开始完成了 Hadoop 分布式集群的搭建。从这一篇笔记开始,我们要通过 MapReduce 计算框架的学习和实践,将集群转化为生产力。
本篇是系列的第一篇笔记。本篇笔记中我们将会手写一个 WordCount 程序。
学习基于阿里云 ECS 云服务器搭建大数据集群的笔记。笔记将搭建步骤和遇到的问题一一记录,用于自己查阅复习,也为小伙伴们提供一定参考帮助。
本篇是笔记的第四部分。上篇笔记完成了基于 ZooKeeper 的高可用集群搭建。本篇将继续实现基于 Yarn 的调度框架配置。
学习基于阿里云 ECS 云服务器搭建大数据集群的笔记。笔记将搭建步骤和遇到的问题一一记录,用于自己查阅复习,也为小伙伴们提供一定参考帮助。
本篇是笔记的第三部分。上篇笔记完成了HDFS 全分布集群搭建。本篇将继续实现基于 ZooKeeper 的高可用集群搭建。
学习基于阿里云 ECS 云服务器搭建大数据集群的笔记。笔记将搭建步骤和遇到的问题一一记录,用于自己查阅复习,也为小伙伴们提供一定参考帮助。
本篇是笔记的第二部分。上篇笔记完成了从服务器准备到 HDFS 伪分布式集群搭建的工作。本篇将继续完成 HDFS 全分布集群的搭建。已经有了伪分布式搭建的经验,全分布的搭建变得非常简单。
学习基于阿里云 ECS 云服务器搭建大数据集群的笔记。笔记将搭建步骤和遇到的问题一一记录,用于自己查阅复习,也为小伙伴们提供一定参考帮助。
本篇是笔记的第一部分,从服务器相关的准备工作开始,到 HDFS 伪分布式集群搭建完成为止。
“不要慌张、不要停止思考、不要放弃生存。”——罗伊·马斯坦