达梦数据

国产数据库“第一股”拟上市,22年试炼场终“达梦”

行业前沿 算力智库 2022/07/08 17:00

6月29日,武汉达梦数据库股份有限公司(以下简称「达梦数据」)正式递交招股书,申请上交所科创板上市。一旦上市成功,将成为国产数据库“第一股”。

犹如一颗重磅“信号弹”,漫漫蛰伏期,国产数据库似乎终于迎来了春天。

“很久没见过这么赚钱的IT公司了”,业内人士纷纷感慨。

招股书显示,2019年至2021 年三年间,达梦数据年营业收入分别为3.02亿元、4.50亿元和7.43亿元,扣非归母净利润分别为7754.46万元、1.32亿元和3.48亿元。

达梦数据主要财务数据(来源:招股书)

有上市计划的并非达梦数据一家,6月21日,星环科技通过上市委会议,拟发行股票数量不超过3021万股,合计募集19.61亿元。

短短一个月内,两家国产数据库厂商接连申请上市,“上市潮”背后,是跌跌撞撞,用了20多年奋起、自研、打磨的国产数据库“长征之路”。

把“冷板凳”坐热,得益于“三把火”

“数据库和操作系统、芯片一样,长期以来都被海外卡脖子”。某位软件行业从业者发出感叹。

回望国产数据库的成长史,一开始便注定艰难。

作为一种对数据进行增删改查和分析的基础软件,数据库起源于美国,发扬于欧美,国产数据库的应用长期处于追随者地位,一个核心节点是,自上世纪80年代后IBM、Oracle等海外关系型数据库厂商纷纷入华,拿下金融、电信等领域核心客户后,国内关系型数据库市场(尤其是OLTP)几乎被外企垄断。也正因起步晚,又错失这一主流战场,长期以来国内数据库企业寥寥可数。直到2010年,叫得出名字的公司只有两位数。

“那时候,我们在数据库上几乎没得选,即使考虑更换数据库平台,但如果迁移,可能会带来更多不可控的风险,谁都不敢这么干,并且甲骨文的议价策略也不透明,比如同样一套产品,小企业买可能十几万元就行,运营商买就要40万元”。据某位曾经经手联通数据库采购项目的人员透露。赛迪顾问数据表明,2011年,中国关键应用大型机系统平均售价已经达到了美国的2.4倍”,绝对的市场“统治力”,让甲骨文、IBM这些巨头在中国一直拥有主导型议价地位。

反观现在,据墨天轮2022国产数据库名录和产品信息统计,国产数据库已达200多家,这其中不仅包括比较“老牌”的关系型数据库,同时图数据库、空间数据库、时序数据库等新型数据库亦占据不小的比重。

从市场角度来看,目前的国产数据库选手可以分为四类:

第一类,云厂商。如:腾讯云,阿里云,华为云等云厂商下场做数据库。占据云生态优势,目前国内全栈的云厂商,使其在软硬件协同方面有机会做一步优化,实现数据库整体性能的提升。

第二类,传统数据库。如:南大通用,达梦,金仓、瀚高等。这类企业的商业模式更多是license(授权许可)模式和软件售卖模式。这类主要为信创数据库公司,占据党政军背景及政策优势。

第三类,新兴初创数据库厂商。新兴数据库厂商:PingCAP、偶数科技、星环科技等;其中,新兴厂商主要是最新一代的面向云原生架构的数据库,架构优势更为明显。 

第四类,跨界厂商。一类企业如:恩墨、海量等,他们从做服务跨界转做数据库。还有一类企业如亚信和中兴,他们之前从某一行业内做行业应用,换到了数据库的赛道,利用原有客户及业务基础,叠加销售。

图来源:艾瑞咨询-2021年中国数据库行业研究报告

国产数据库队伍不断壮大的同时,吸金能力也在水涨船高。据中国信通院统计分析,自2013 年至今,数据库企业累计完成约42 次融资,融资额度总计约为78.6 亿元。仅2021年一、二季度期间,获得最新一轮融资的企业数就达12 家。延续到2022年,云原生实时数仓厂商飞轮科技天使轮和天使+轮获超3亿元融资,分布式数据库和AI PaaS平台天云数据获得数亿元D轮融资,这一番融资胜景下,无不昭示着寒冬已久的国产数据库终于把“冷板凳”坐热了。诚如CSDN 创始人&董事长、极客帮创投创始合伙人蒋涛豪言:“中国已经进入“人人都是开发者,家家都是数据公司”的新数据库时代了”。

把“冷板凳”坐热,得益于“三把火”。

1999年起,第一批国产数据库的成立添了“第一把火”,国产开始萌芽,自此各厂商开启长达20年的实践之路,相对减少了与国际对手的能力差距。

其后,第二把火则在于中国在过去10年间深度参与了移动互联网浪潮,国内互联网和IT巨头诞生,“去IOE”浪潮兴起,成为国产替代的开端。

最核心的“第三把火”则要归功于信创崛起,直观可见的是带来了客户侧需求的爆发。

2018年以来中兴、华为被制裁事件的发生为国内各大企业敲响了关键环节被“卡脖子”的警钟,方才意识到只有“国产自研可控”才能活命。

2020年是启动金融信创一期试点的元年,主要是头部的银行、保险、证券、期货、支付金融机构参与,要求信创基础软硬件采购额占到其IT 外采的5-8%。

2021年金融信创二期新增100 余家试点单位,信创基础软硬件在IT 外采中占比要求提高至10-15%。

2022 年1 月26 日,银保监会公开印发《关于银行业保险业数字化转型的指导意见》,意见强调“对业务经营发展有重大影响的关键平台、关键组件以及关键信息基础设施要形成自主研发能力,降低外部依赖”,这也即意味着2022 年金融信创将进入全面推广阶段,且信创基础软硬件在IT外采中占比要求有望提高至15-25%。

以中国工商银行为例,其2020 年信创基础软硬件支出达到IT 外采的22%;中国银行也预计2022 年信创基础软硬件支出达到10 亿以上,占IT 外采的20%以上,从中可以看出大型金融机构信创投入力度明显高于政策要求,据此进行测算,预计至2025年信创基础软硬件在金融机构IT 外采中占比有望达到50%-65%。

市场需求的激增,政策东风的吹来,以及厂商们持续积累的产品能力,天时地利人和下,国产数据库实现了里程碑式的进击。

党政“投喂”:超强赚钱能力好复制吗?

达梦数据最“吸睛”的便是其出色的营业收入,年净利润超4亿元。

这种超强的赚钱能力是好“复制”的吗?
如果仔细观察下,就会发现其大多收入都来自党政领域,尤其是在2020年,公司党政领域的收入占比达到62.78%。


从招股书上,很明显的可以看出,达梦数据收入结构主要依赖党政企业大客户,党政领域俨然是达梦科技的“创收招牌”,但也有业内人士表示:“对数据库而言,在单一领域的能力并不能完全复制到其他领域。并且这种党政优势,也并不是其他相对初创新兴的企业所能短时间“复制”的,党政客户源有很大原因是在于国资背景和股东方的加持和助力”。

招股书显示,被中国电子(CEC)控股的中国软件,持有达梦数据25.21%的股权。中国电子(CEC)是谁?它是中央直接管理的国有独资特大型集团公司,也是中国最大的国有IT中央企业,CEC的生态包括麒麟软件、飞腾芯片、长城整机等角色——这正是一套完整的信创技术底座,数据库作为三大基础软件之一,需要和底层硬件、操作系统,以及上层应用紧密配合,毫无疑问,这些关联上下游都将成为达梦数据的生态伙伴以及客户渠道的拓展源。

而且,从产品层面看,“党政客户的业务特点,很少对数据库7*24小时的运行能力提出高要求,但是对文本处理、图形化等功能的要求比较高。金融、运营商客户就会要求高健壮性和高响应性”。上述那位业内人士指出。

数据库商业化与党政军的深度捆绑,也说明了国产数据库在商业领域上的“打单”仍局限自家的“一亩三分地”,抛开“党政投喂”,如何精进产品,向金融、交通、能源、电信、电力等更多战场开拓,以及更远的目标,向国际化进军,是国产数据库亟待补充的能力区。

商业化的掣肘只是一面,另一个“软肋”便是研发成本的居高不下以及研发能力的后继乏力。以达梦科技为例,从第一行代码到进入市场的第一款数据库产品,达梦用了近20年,前期投入较大、周期长,研发门槛高,对于新兴厂商来说,前期能否有足够的资金撑过漫长的研发期,是个不小的挑战,即便产品打磨好,找到自己的商业化道路,短时期内也较难实现盈利,比如MongoDB、达梦均是在创立10余年过后才基本达到收支平衡。

除此之外,有一点,颇为玩味的是,达梦的研发投入占营业收入的比例从2019到2021,这两年居然是递减的,从20.74%降到了15.86%;截止到2021年12月31日,公司总共有研发人员332名,占公司员工数比例31.35%,这个比例对于数据库公司而言,其实并不算高,达梦科技只是“杯中一栗”, 对于国内正在大大小小日趋涌入的数据库企业来说,很难说不会泥沙俱下,原本就起步较晚,人才储备、资金投入都不太足够的国产数据库产业,再被割裂为这么多的细小单位,每个独立个体的真实能力就很值得怀疑了。

据相关统计,国内超过60%的数据库厂商不足100人,而超过500人的企业不足10%,且国内最大的数据库厂商的研发人员不足500人。某位技术人员对此直言:“对于想摘取IT基础设施王冠的中国数据库企业,最大的企业规模可能还不如某个哪怕二三流的国外数据库厂商的一个小研发部门的规模”。虽然此言可能略有夸张,但也或多或少的折射出了国产数据库研发动能的不足。

落在技术栈上,差距也并不小,在OLTP上,一直由Oracle、IBM DB2、MySQL、SQL Server等占据主话语权,市场份额超90%,从专利数量上看,截止2020年,单Oracle公司一家企业的专利数就超过1万4千件,而国内90%数据库企业的数据库领域专利数少于100件,所有关系型数据库(OLTP)厂商的专利数加在一起不足4000件,实属软肋中的“软肋”。

做数据库一定要有生态

重重环伺下,国产数据库下一步怎么突破?

Scale Partners势乘资本认为: 数据库公司的发展遵循内核-外壳-生态的主要路径:内核组件和底层能力为基础,外部组件为支撑,生态为商业化及产品迭代重要路径。

首先,底层代码积累与产品迭代需要与具体业务场景深度融合,“目前国家要求金融行业全替换,也是针对办公系统的数据库全替换, 在业务系统层面更多的是在小业务系统上做实验,现在去谈核心业务系统的数据库国产化还为时尚早。阿里、腾讯的数据库产品之所以能够成为国内代表,依靠的是与自身电商、支付、社交等核心业务场景的不断打磨,而其他数据库公司之前难以拥有这样的机会。 因此,厂商要先争取拿到小业务系统的备份系统机会”。Scale Partners势乘资本分析师王圆珍表示。

另外,数据库云化也是大势所趋,虽然是关于部署形态、架构形态的问题,但是对底层技术能力的掌握和提升仍然重要。数据库包括数据库内核、分布式组件和接口驱动,SQL引擎、事务引擎和存储引擎,是否支持多副本、分布式事务、高性能、扩展能力、故障恢复、优化器、多活容灾、语法兼容等核心技术,这些技术需求都是决定数据库产品性能的重要要素。

外壳层面,大数据与数据库一体化成为新晋方向,需要厂商完善外部组件部分,自研或兼容主流生态组件,完善产品力为进一步发展作支撑。达梦和星环的产品路径也在朝着这个方向演进,如今不仅提供底层的数据库产品,大数据应用平台与数据库一体化也正在布局。

在与国外厂商的博弈中,生态的重要性也在凸显。Oracle早期占领中国市场,其核心因素之一便是合作伙伴生态,早期Oracle中国区90%以上收入来自2000多个合作伙伴。而达梦数据,作为2020年中国拥有合作伙伴最多的数据库,也仅仅只有101 家合作伙伴。其他的数据库厂商合作伙伴均低于50 家。

做数据库一定要有生态,自从X86替换小型机,DB2的市场份额逐渐下降;软硬件分离的趋势,导致Intel、微软的操作系统得以普遍应用,在此生态下才有Oracle、MySQL发展壮大的机会。不同客户核心架构系统不同,存在不同程度的定制化开发诉求。数据库作为基础软件,需要完成芯片、服务器、操作系统、中间件的适配工作,集成商、二次开发商、IT 咨询公司都是数据库厂商生态伙伴体系中的重要参与者,自建生态难度较大,兼容生态为主要选择。 生态伙伴赋能企业在快速实现业务扩张的同时最大程度减少成本增长,使得企业能将有限的人员和资金投入到核心技术和核心产品。”Scale Partners势乘资本分析师王圆珍强调。

怎么拓展生态呢?开源或是路径之一。

“开源正在吞噬数据库”,某位数据库从业者如是说,并将其视为数据库技术进入新时代的标志。

的确,在数据库领域中,开源的“吞噬”情况十分明显。dbdb.io(卡内基梅隆大学维护的全球数据库信息库)分析了全球知名的841个数据库系统,其中开源数据库有608个,占比72%,只有200多家是商业数据库。在全球顶尖数据库排行榜中,开源数据库也占到一半,国内阿里旗下OceanBase、PolarDB、华为OpenGuass、腾讯Tendis、TiDB等国产数据库产品纷纷走上开源之路。

来源:CSDN

“开源作为一种高效的、全球协作的方式,相比传统的协作方式更加简单和直接,通过类似于GitHub这样的协作平台可以得到全球用户的快速反馈,开发者可以直接面向使用者,迭代非常迅速,并且以此也可以吸引更多用户去尝试,从而帮助开源产品实现快速推广”。这位数据库从业者说到。


参考资料

光锥智能《信创风起,国产数据库集体冲刺科创板》

光锥智能《大变局:国产数据库的机遇与挑战》

墨天轮《2022 :国产数据库名录和产品信息一览》

ZAKER《寒冬之下持续吸金,蛰伏30年的国产数据库终迎黄金时代?》

数智前线《国产数据库:三座大山下的妥协与突围》

36Kr《三年内收入翻倍,2021年净利润超3亿,国产数据库头部公司冲击科创板|IPO观察》

码农翻身《国产数据库的乱象》