大数据技术基础
数据处理、数据分析、数据思维
MapReduce: 数据处理平台,可进行并行计算,将多台计算机联系起来并行计算,程序员只需要编写map和reduce两个函数即可
适合使用mapreduce处理的数据:待处理的数据可以分解成许多小的数据集,而且每个数据集都可以完全并行的进行处理
Hadoop:
HDFS: 分布式文件系统,将数据分隔成小块,并且在集群节点上复制,从而达到数据的容错性和可靠性
Hive: 一个数据仓库系统,为用户提供SQL接口,允许用户对HDFS中的数据进行SQL操作,将SQL操作转换为MapReduce任务
Pig
1、粗略理解大数据
2、将学习通的题、老师说的考题整合
3、开始专门学习做题方法
4、背一下简答题
All articles in this blog are licensed under CC BY-NC-SA 4.0 unless stating additionally.



