一、 课程基本信息

二、 课程简介
本课程是大数据开发岗位对应课程之一,主要培养学生对大数据架构的理解、大数据平台的搭建与管理,以及常用大数据组件的管理及应用等大数据核心基础内容。具体内容包括大数据概述;Hadoop架构分析;核心组件原理及应用;数据仓库Hive原理及应用;协调服务Zookeeper应用场景介绍;Hadoop集群运维等。
三、 课程目标
1. 知识目标
1.1 理解大数据所带来的数据变革和大数据时代的机遇与挑战。
1.2 理解大数据平台的分布式架构,掌握开源及商业化大数据平台的差异。
2. 技能目标
2.1 掌握大数据平台的安装部署,能够独立完成大数据平台的集群搭建。
2.2 掌握大数据平台核心组件的使用,能够将数据上传至大数据平台,能够进行大数据分析计算,能够对集群进行配置及管理。
2.3 熟悉大数据的常用周边组件,掌握大数据数仓的概念及使用方式,熟悉大数据协调服务的原理及使用方式。
2.4 熟悉集群的日常维护手段,能够完成常规集群的维护管理,备份恢复的操作。
3. 素质目标
3.1 具备一定的数据思维和架构思维。
3.2 养成良好的中、英文技术资料的查询、阅读和自学能力。
四、 课程内容


五、 课程考核
本课程考核采用实践考核的方式。
实践考核采用考核题的成绩,分数分别为(20,20,15,15,15,15),满分100分。考核题评分综合考虑任务完成情况、结果正确性、提交准时性等因素。评分方法参考各考核题评分标准。
六、参考书
Hadoop权威指南:大数据的存储与分析(第4版),[美] 汤姆,怀特(Tom White) 著,王海,华东,刘喻,吕粤海 译,清华大学出版社,2017年7月1日
Hadoop数据分析,[美] 本杰明·班福特(Benjamin Bengfort) 著,王纯超 译,人民邮电出版社,2018年4月1日