data:image/s3,"s3://crabby-images/ede28/ede283a44cbd846d874e68f034e5dc85ab1bb18c" alt=""
Hive的工作原理
data:image/s3,"s3://crabby-images/e531e/e531e24ec5c49060deeabc2c01fdb6715be40d01" alt=""
下表定义Hive和Hadoop框架的交互方式:
data:image/s3,"s3://crabby-images/3f609/3f60991b7e6bf7d3769ef12e03231f2b5e9000d8" alt=""
Handoop 的结构
data:image/s3,"s3://crabby-images/3e991/3e99174150635b7fbf1ad5ae2d660ffe3e4e7f35" alt=""
(1)Pig是一个基于Hadoop的大规模数据分析平台,Pig为复杂的海量数据并行计算提供了一个简单的操作和编程接口;
(2)Hive是基于Hadoop的一个工具,提供完整的SQL查询,可以将sql语句转换为MapReduce任务进行运行;
(3)ZooKeeper:高效的,可拓展的协调系统,存储和协调关键共享状态;
(4)HBase是一个开源的,基于列存储模型的分布式数据库;
(5)HDFS是一个分布式文件系统,有着高容错性的特点,适合那些超大数据集的应用程序;
(6)MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。
Handoop 集群部署
data:image/s3,"s3://crabby-images/d84b0/d84b057f14782b14c572015cc5c52c61d07a1245" alt=""
Handoop 组件依赖关系
data:image/s3,"s3://crabby-images/c587e/c587e2117265108577b61fe7e908e34d2ae163be" alt=""
Handoop的核心
data:image/s3,"s3://crabby-images/20f64/20f641305b22c9b8d380b95b3b66b3e853bfd288" alt=""
data:image/s3,"s3://crabby-images/f9549/f95491b1620ffe76731fcadec4035430ec03ccda" alt=""
参考资料:
https://blog.csdn.net/zl834205311/article/details/80334346
https://www.cnblogs.com/tieandxiao/p/8799287.html
https://www.yiibai.com/hive
https://www.jianshu.com/p/d68272609bf8