本案例库课程目标是基于开源hadoop生态系统构建面向大数据时代人才培养的数据科学分析实践平台,以真实场景为示范实现企业数据开发与管理能力培养,专注培养专业学位学生数据抽取、数据集成、数据分析、数据展示综合能力,从大数据存储、大数据并行处理算法、大数据分析应用三个维度,让学生掌握实现大数据分析应用的基本工具、开发语言、实现算法与应用集成,培养学生实现单机数据处理到多机数据处理的跨越,实现从数据处理到知识处理的提升。
1.大数据4v特征分析与处理流程
2.hdfs文件系统原理与存储实践
3.mapreduce编程模型与实践
4.hbase数据模型与数据管理实践
5.垂直搜索引擎原理与实践
6.hive数据仓库原理与实践
7.多维数据仓库构建与主题分析
8.图计算与内存计算引擎与实践
9.基于大数据的个性化推荐算法实现
10.基于大数据的主题事件检测与演化分析
参考书目:
1.利用python进行数据分析 o’reilly,机械工业出版社,唐学韬等译
2.hadoop大数据分析与挖掘实战 张良均等,机械工业出版社
3.spark大数据处理 技术、应用与性能优化 高彦杰著,机械工业出版社