首页 > 生活 > 生活妙招

hadoop是什么(hadoop的功能作用是什么)

常驻编辑 生活妙招 2022-03-12 作用   功能   hadoop

大数据之Hadoop简介

dqQ拜客生活常识网

Hadoop简介

Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),dqQ拜客生活常识网

其中一个组件是HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据。Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,而MapReduce则为海量的数据提供了计算 。dqQ拜客生活常识网

Hadoop 由许多元素构成。其最底部是 Hadoop Distributed File System(HDFS),它存储 Hadoop 集群中所有存储节点上的文件。HDFS的上一层是MapReduce 引擎,该引擎由 JobTrackers 和 TaskTrackers 组成。通过对Hadoop分布式计算平台最核心的分布式文件系统HDFS、MapReduce处理过程,以及数据仓库工具Hive和分布式数据库Hbase的介绍,基本涵盖了Hadoop分布式平台的所有技术核心。dqQ拜客生活常识网

发行版本

Hadoop有三大发行版本:Apache、Cloudera、HortonworksdqQ拜客生活常识网

  • Apache 最基础的版本 apache版
  • Cloudera 企业中使用最多的版本(收费) cdh版
  • Hortonworks 文档较好

优势

  • 高可用 Hadoop底层维护了多个数据副本,即使某个计算元素或者存储出现故障,也不会导致数据的丢失
  • 高扩展 在集群间分配任务数据,可方便的扩展数以千计的节点
  • 高效性 Hadoop并行工作,加快任务处理速度
  • 高容错性 可以自动将失败的任务重新分配

配置

配置文件在hadoop下/etc目录下,有几个重要的配置文件dqQ拜客生活常识网

core-site.xml

这是hadoop的核心配置文件dqQ拜客生活常识网

dqQ拜客生活常识网

相关阅读:

  • 瑜伽垫可以睡觉用吗?瑜伽垫有什么作用?
  • 扭腰器有什么作用?扭腰器的作用[图]
  • 健身多久能看到效果?健身要多久才有效果?[图]
  • 应急包里面装什么东西
  • 不要盲目补充!钙铁锌的作用与功效要先知悉
  • 《云南虫谷》霍氏不死虫红雾有何作用?猫头鹰为何不伤害
  • 日常缺乏蛋白质有何影响?蛋白粉有什么作用?
  • 灰甲清效果怎么样(灰甲清作用)
  • 罗技g102怎么样(罗技g102每个按键的作用)
  • 康萃乐益生菌怎么样(康萃乐益生菌的作用与功效)
    • 网站地图 |
    • 声明:登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不做权威认证,如若验证其真实性,请咨询相关权威专业人士。