Future Tech

[转贴] 甲骨文断供俄罗斯!中国数据库能否一战?数据库产业深度报告 | 智东西内参

Tan KW
Publish date: Sun, 13 Mar 2022, 07:34 AM
Tan KW
0 464,383
Future Tech
甲骨文断供俄罗斯!中国数据库能否一战?数据库产业深度报告 | 智东西内参

近期,俄乌冲突持续焦灼,美欧也一直没闲着,除了直接提供武器物资,制裁大棒一刻没停下。3月3日,乌克兰副总理米哈伊洛·费多罗夫在社交媒体向50多家美国科技公司发起呼吁,用科技战逼退俄罗斯的军队,呼吁这些企业断供俄罗斯。短短三小时内,甲骨文就第一个宣布,暂停俄罗斯所有业务。紧随其后,IBM、英特尔、谷歌、苹果、微软、Facebook、亚马逊、戴尔等20多家美国科技公司也宣布对俄罗斯进行制裁。

数据库是IT行业的核心环节,而甲骨文是商业数据库最有代表性的科技巨头。甲骨文与IBM、EMC公司合作,形成了一条完整的数据库产业链,称作“IOE”架构。可喜可贺的是,我国早在10多年前就开始布局了“去IOE”化。2021上半年中国公有云关系型数据库规模6.7亿美元,叱咤风云的甲骨文,则仅占3.6%。中国企业,有了属于自己的数据生态。但是,数字经济的不断发展,我国自主的数据库产业仍远远不够。

本期的智能内参,我们推荐招商证券的报告《数据库深度复盘与展望》,七大维度全面梳理数据库发展历程,分析国内数据库市场发展趋势。

来源 招商证券

原标题:

《数据库深度复盘与展望》

作者:刘玉萍

一、七大维度看数据库发展历程

回顾数据库70年发展历程,分布式、云计算、人工智能等创新技术和基础设施的发展陆续为演化注入新活力。以下我们将从数据模型逻辑、技术架构、需求功能、部署方式、存储介质、商业模式、数据库治理模式等七大维度对数据库发展脉络进行详细阐述,理清行业演化逻辑与发展趋势。

甲骨文断供俄罗斯!中国数据库能否一战?数据库产业深度报告 | 智东西内参

数据库发展历程

数据模型的演化本质由底层数据规模、逻辑关系、类型等驱动,其路径是:层次->网状->关系->关系、非关系并行。 在当前关系、非关系并行时代,新型NewSQL与多模数据库快速发展。传统SQL受限于其拓展性,在大数据发展下逐渐面临瓶颈, 而NewSQL提供了与NoSQL相同的可扩展性,而且仍基于关系模型,保留了极其成熟的SQL作为查询语言,从而保证了数据的强一致性;同时,基于分布式架构,对接多种数据模型引擎,避免搭建多种类数据库的多模数据库快速发展。

甲骨文断供俄罗斯!中国数据库能否一战?数据库产业深度报告 | 智东西内参

数据库模型发展路径

数据库前期的演化史本质上是关系型数据库的演化,关系型数据库已统治市场超过 50年。关系型数据库以二维表形式存储实体和关系,具有易理解、易使用、易维护,自1970年诞生以来,逐步成为业界的霸主。时至今日,关系型数据库不断融入分布式、云原生、AI等新兴技术持续进化,仍是数据库的主流,据DB-Engines热度排名(截至2022/02),前四大数据库Oracle、MySQL、Microsoft、PostgreSQL均为关系型数据库,且分数遥遥领先。

SQL是关系型数据库的标准语言,相比C、Java、Python等编程语言,SQL贴合口语的设计使得其代码复杂度大大简化、便于数据分析人员上手,同时嵌入式的设计也保证了SQL可以被其他编程语言轻松调用,据TIOBE统计,SQL在近20年稳居TOP10编程语言榜单。关系型数据库的二维表数据存储模式为关系型数据库的流行普及提供了环境基础;而SQL语言的流行也反哺了关系型数据库的推广,两者相辅相成,共赢于数据库市场。

甲骨文断供俄罗斯!中国数据库能否一战?数据库产业深度报告 | 智东西内参

DB-Engines流行数据库排名前十

随着互联网业务规模快速增长,拥有灵活拓展与高读写并发能力NoSQL数据库得到快速发展。由于传统的关系型数据库在保证数据强一致与系统可用的前提下,其水平扩展能力受到限制;非关系型数据库NoSQL则是基于分布式存储原理,放弃了传统的关系模型,在一致性与可用性之间寻求平衡,从而保证了系统地灵活拓展与高读写并发能力。随着社交媒体等互联网业务快速发展,数据量激增,传统关系型数据库性能逐渐达到瓶颈,因此,以保证拓展性与高并发性能为前提地NoSQL数据库得到快速发展。

为了应对数据的海量增长并追求更低的扩容成本,数据库由单机、集中式向分布式架构快速发展。随着信息化水平快速提升,对数据库的存储、读写并发、扩容要求更高,集中式架构的“Scale Up”纵向扩容机制面临硬件性能瓶颈,因此“Scale Out”式的横向扩容分布式架构成为新趋势,通过网络将物理分散的数据库单元连接为逻辑上的统一整体。从集中式到分布式的演进降低了对硬件性能的要求,使得企业数据库拓展成本大幅降低。

分布式架构由共享磁盘、共享内存架构,逐步向纯无共享架构发展,在无共享架构中,每个处理器私有内存和磁盘空间,利用网络通信,“Scale Out”式横向增加处理器和相应的内存、磁盘,从而避免事务对内存访问和网络带宽的竞争,提高处理性能。国产方面,无共享分布式架构已经趋于成熟,如PingCAP的TiDB、华为的GaussDB、蚂蚁的Oceanbase、达梦的达梦+、阿里云的PolarDB、腾讯云TDSQL、南大通用的GBase、人大金仓的KingBase、中兴通讯的Golden DB等分布式数据库均为MPP无共享架构。

甲骨文断供俄罗斯!中国数据库能否一战?数据库产业深度报告 | 智东西内参

▲各架构对比

需求功能决定数据库逻辑架构,逻辑架构决定访问性能。为实现海量数据存储、在线高并发,并同时支持OLTP和OLAP的功能,HTAP应运而生,按照具体架构可分为3类:

甲骨文断供俄罗斯!中国数据库能否一战?数据库产业深度报告 | 智东西内参

▲HTAP不同架构

根据墨天轮排名(截至2022/02),目前国内前六大数据库均为HTAP+分布式架构,包括PingCAP的TiDB、华为openGauss、蚂蚁OceanBase、达梦的达梦+、华为GaussDB、阿里PolarDB。其中排名第一的PingCAP基于Google的Spanner模型和Stanford的Raft算法研发TiDB数据库,借助底层数据同步及行列透明转换技术,将面向联机交易的行存引擎与面向实时分析的列存引擎融合改造为行列混合数据架构。在HTAP技术浪潮中,TiDB数据库凭借水平线性扩展、强一致分布式事务、故障自恢复的金融级高可用、真正跨数据中心多活等核心特性拔得头筹。

部署方式的演化上,数据库上云成为重要发展趋势。随着云基础设施的成熟和企业解放DBA运维难度的需求日渐迫切,将传统数据库直接部署在云端,由云厂商提供安装和维护服务的云托管数据库逐渐受到业内追捧。据Gartner预测:2023年云DBMS收入将占DBMS市场总收入的50%,75%的数据库将部署在云端。在数据库上云过程中,数据迁移是最大的痛点。针对企业面临的完整性、安全性、一致性等难题,市场催生了安畅网络、数腾软件等提供数据上云迁移的第三方公司。

据IDC统计,2021年H1中国关系型数据库本地部署模式被Oracle、华为、Microsoft、IBM垄断,而同期的公有云部署市场由阿里巴巴、腾讯、AWS和华为领衔。2020年,阿里云陆续推出Lindorm、PolarDB-X、ADB等云原生分布式数据库,是首家Gartner全球数据库魔力象限归入领导者象限的国内厂商。腾讯云研发TDSQL-C,积极拥抱开源,100%兼容MySQL 和 PostgreSQL,实现超百万级QPS高吞吐,助力中小企业,连续两年增速全球前三。华为云深耕金融行业信创,早在2015年就开始部署上线业界首个AI Native的云原生数据库GaussDB。

商业模式上,已逐渐成为数据库产业的共识。2021年1月,根据DB-Engines,全球数据库开源许可证流行度首次超过商业许可证,开

 

https://zhidx.com/p/319911.html

Discussions
Be the first to like this. Showing 0 of 0 comments

Post a Comment