HBase 分区 (region)

Submitted by Lizhe on Thu, 04/27/2017 - 17:47

HBase中扩展和负载均衡的基本单元称为region 

region是使用rowkey进行排序的连续存储空间 ( HBase的region和HDFS中的文件不是一个概念)

一个table一开始只有一个region,随着存储数据的增长而增加

每个region只会由一个region server加载, 一个region server一般(最佳) 加载10~1000ge 个region

当存储的数据大小超过配置的最大值时, region会采取一种"分裂"的机制来让自己变成2个region

(系统会在middle key处将region拆分成两个)

 

再强调一次

HBase的region和HDFS中的文件不是一个概念

region在拆分后,仍然会使用原来的存储文件, 直到合并动作(需要离线后使用工具)运行后,把存储文件异步地写成独立的文件