来源: 最后更新:24-06-28 06:26:03
1、Hadoop主要是分布式计算和存储的框架,所以Hadoop工作过程主要依赖于HDFS(Hadoop Distributed File System)分布式存储系统和Mapreduce分布式计算框架。
2、分布式存储系统HDFS中工作主要是一个主节点namenode(master)(hadoop1.x只要一个namenode节点,2.x中可以有多个节点)和若干个从节点Datanode(数据节点)相互配合进行工作。
3、HDFS主要是存储Hadoop中的大量的数据,namenode节点主要负责的是:接收client用户的操作请求,这种用户主要指的是开发工程师的Java代码或者是命令客户端操作。维护文件系统的目录结构,主要就是大量数据的关系以及位置信息等。管理文件系统与block的关系。
4、Hadoop中大量的数据为了方便存储和管理主要是以block块(64M)的形式储存。一个文件被分成大量的block块存储之后,block块之间都是有顺序关系的,这个文件与block之间的关系以及block属于哪个datanode都是有namenode来管理。
标签: hadoop是做什么的
寺庙住持与女主播发生关系被敲诈案续:男方将上诉,辩称系“控制下交付”
上海大众汽车制造厂 上海大众汽车制造厂招聘上海汽车厂(上海大众汽车制造厂)2021-09-18 08:20汽车与配件2021年
哈佛热水器全国维修电话 哈佛电热水器售后电话 嘉兴大学校园通行码如何获取(嘉兴学院 校园卡) 嘉兴大学预约入口(嘉兴大学预约入口网址) 2024泰安宁阳县暑期大学生返家乡社会实践活动报名通知2024烟台青华中学高中部招生咨询电话 烟台2021青华中学招生简章