HBase 体系结构
在HBase中,表被分割成区域并由区域服务器提供服务。区域按列族垂直划分为“商店”。商店被保存为HDFS文件。下面显示的是HBase的体系结构。
注意: 术语'商店'用于区域来解释存储结构。
HBase有三个主要组件:客户端库,主服务器和区域服务器。区域服务器可以根据需要添加或删除。
1. MasterServer
主服务器
- 将区域分配给区域服务器,并借助Apache ZooKeeper执行此任务。
- 处理跨区域服务器区域的负载均衡。它卸载繁忙的服务器并将区域转移到占用较少的服务器。
- 通过协商负载平衡来维护集群的状态。
- 负责架构更改和其他元数据操作,如创建表和列族。
2. 地区
区域只不过是分割并遍布区域服务器的表格。
区域服务器
区域服务器具有以下区域 -
- 与客户沟通并处理与数据相关的操作。
- 处理其下所有区域的读取和写入请求。
- 按照区域大小阈值决定区域的大小。
当我们深入了解区域服务器时,它包含区域和商店,如下所示:
该商店包含内存存储和HFiles。Memstore就像一个缓存内存。输入到HBase中的任何内容都将存储在此处。稍后,数据将作为块传输并保存在Hfiles中,并刷新内存。
3. Zookeeper
- Zookeeper是一个开源项目,提供维护配置信息,命名,提供分布式同步等服务。
- Zookeeper具有代表不同区域服务器的短暂节点。主服务器使用这些节点来发现可用的服务器。
- 除可用性外,节点还用于跟踪服务器故障或网络分区。
- 客户端通过zookeeper与区域服务器通信。
- 在伪和独立模式下,HBase本身会照顾动物园管理员。