大数据
1、概述
由于Hadoop已经成为业界的大数据标准平台,许多公司都推出了各自版本的Hadoop,也有一些公司则围绕Hadoop开发产品。在Hadoop生态系统中,规模较大、知名度较高的公司则是Cloudera。Cloudera公司推出的CCAH是目前全球的大数据管理员国际认证。
Apache Hadoop管理工程师认证(Cloudera CertifiedAdministrator for Apache Hadoop ,CCAH)CCAH认证要求学员具备管理员在配置、部署、维护以及保护Apache Hadoop集群以及包括Hive,Impala,Yarn等在内的生态系统项目时所必需的技术知识、技能与能力。
2、Hadoop培训基础
本课程适合于有一定javaSE基础知识(不需要了解jsp/servlet等web内容,对SSH框架无要求),对数据库和sql语句有一定了解,熟练使用linux系统的人士,无需具备 Hadoop基础和经验。
3、Hadoop培训对象
系统管理员或者任何需要管理 Apache Hadoop 机群的人员(包括产品及开发环境)。
企业管理者、CIO、CTO、政府信息部门官员、项目(开发)经理、顾问
IT经理,IT顾问,IT支持专家
系统工程师、数据中心管理员、云计算管理员及想加入云计算队伍的您
4、Hadoop认证考试
我们建议参加培训的学员准备并参加 Cloudera Certified Administrator for Apache Hadoop (CCAH)认证考试。
5、Hadoop学习内容:
Hadoop 分布式文件系统和MapReduce工作原理
Hadoop 集群硬件配置规划
Hadoop 集群网络配置规划
Hadoop 集群配置及优化
如何配置NameNode HA
任何配置NameNode Federation
任何配置FairScheduler为多用户共享Hadoop 集群
任何为Hadoop 集群安装和实现基于 Kerberos 的安全性
如何维护和监测Hadoop 集群
如何使用Flume加载动态产生的文件以及使用Sqoop连接关系数据库进行数据导入导出
Hive、Pig和HBase等Hadoop 生态系统工具相关的系统管理工作
6、Hadoop教学大纲
介绍 Apache Hadoop的应用场景
Hadoop 分布式文件系统
Hadoop 数据载入
YARN和MapReduce
规划Hadoop机群
Hadoop 安装和基本配置
安装配置Hive,Impala和 Pig
Hadoop 客户端
Cloudera Manager
高级配置
Hadoop 安全
管理和调度作业
机群维护
机群监测和排错
结论
附录:Kerberos 配置
附录:HDFS Federation配置