分布式数据库:如何正确选择分片键?
分布式數(shù)據(jù)庫
:如何正確選擇分片鍵?
我們知道分布式數(shù)據(jù)庫是將數(shù)據(jù)打散到不同節(jié)點(diǎn)上存儲(chǔ) ,從而提升性能與可靠性。那么今天我們來看看在分布式數(shù)據(jù)庫中,一個(gè)非常重要的設(shè)計(jì) :正確地把數(shù)據(jù)分片 ,充分發(fā)揮分布式數(shù)據(jù)庫架構(gòu)的優(yōu)勢(shì)。
選出分片鍵
在對(duì)表中的數(shù)據(jù)進(jìn)行分片時(shí),首先要選出一個(gè)分片鍵(Shard Key),即用戶可以通過這個(gè)字段進(jìn)行數(shù)據(jù)的水平拆分 。
對(duì)于我們之前使用的電商業(yè)務(wù)的訂單表orders,其表結(jié)構(gòu)如下所示:
CREATE TABLE `orders` ( `O_ORDERKEY` int NOT NULL, `O_CUSTKEY` int NOT NULL, `O_ORDERSTATUS` char(1) NOT NULL, `O_TOTALPRICE` decimal(15,2) NOT NULL, `O_ORDERDATE` date NOT NULL, `O_ORDERPRIORITY` char(15) NOT NULL, `O_CLERK` char(15) NOT NULL, `O_SHIPPRIORITY` int NOT NULL, `O_COMMENT` varchar(79) NOT NULL, PRIMARY KEY (`O_ORDERKEY`), KEY `idx_custkey_orderdate` (`O_CUSTKEY`,`O_ORDERDATE`), KEY `ORDERS_FK1` (`O_CUSTKEY`), KEY `idx_custkey_orderdate_totalprice` (`O_CUSTKEY`,`O_ORDERDATE`,`O_TOTALPRICE`), KEY `idx_orderdate` (`O_ORDERDATE`), KEY `idx_orderstatus` (`O_ORDERSTATUS`), CONSTRAINT `orders_ibfk_1` FOREIGN KEY (`O_CUSTKEY`) REFERENCES `customer` (`C_CUSTKEY`)) ENGINE=InnoDB對(duì)于類似淘寶、京東 、拼多多這樣業(yè)務(wù)體量的應(yīng)用來說,單實(shí)例 MySQL 數(shù)據(jù)庫在性能和存儲(chǔ)容量上肯定無法滿足“雙 11、618 ”大促的要求,所以要改造成分布式數(shù)據(jù)庫架構(gòu)。
而第一步就是要對(duì)表選出一個(gè)分片鍵,然后進(jìn)行分布式架構(gòu)的設(shè)計(jì)。
對(duì)于上面的表orders ,可以選擇的分片鍵有:o_orderkey 、o_orderdate 、也可以是o_custkey