TGTGInsighttelegram intelligenceLIVE / telegram public index
← 新·世界观察日志
新·世界观察日志 avatar

TGINSIGHT POST

Post #1447

@NewWorldObservationLog

新·世界观察日志

Views675帖子阅读量
发布4月17日2023/04/17 09:32
Post content

帖子内容

分布式数据库是伪需求吗? 分布式数据库的核心权衡是:“以质换量”,牺牲功能、性能、复杂度、可靠性,换取更大的数据容量与请求吞吐量。但分久必合,硬件变革让集中式数据库的容量与吞吐达到一个全新高度,使分布式(TP)数据库失去了存在意义。 以 NVMe SSD 为代表的硬件遵循摩尔定律以指数速度演进,十年间性能翻了几十倍,价格降了几十倍,性价比提高了三个数量级。单卡 32TB+, 4K随机读写 IOPS 可达 1600K/600K,延时 70µs/10µs,价格不到 200 ¥/TB。跑集中式数据库单机能有一两百万的点写/点查 QPS。 真正需要分布式数据库的场景屈指可数,典型的中型互联网公司/银行请求数量级在几万到几十万QPS,不重复TP数据在百TB上下量级。真实世界中 99% 以上的场景用不上分布式数据库,剩下1%也大概率可以通过经典的水平/垂直拆分等工程手段解决。 头部互联网公司可能有极少数真正的适用场景,然而此类公司没有任何付费意愿。市场根本无法养活如此之多的分布式数据库内核,能够成活的产品靠的也不见得是分布式这个卖点。HATP 、分布式单机一体化是迷茫分布式TP数据库厂商寻求转型的挣扎,但离 PMF 仍有不小距离。 https://mp.weixin.qq.com/s/-eaCoZR9Z5srQ-1YZm1QJA