京东6.18大促主会场领京享红包更优惠

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 925|回复: 0

陪跑40多年,中国数据库终于迎来黄金时代

[复制链接]

1598

主题

709

回帖

6633

积分

论坛元老

积分
6633
发表于 2023-3-16 12:59:46 | 显示全部楼层 |阅读模式 来自 江苏南通

: ?) B* c; v6 Q5 S, S. I% [! }+ ~
) F0 O5 P4 N2 w+ q2 a2 l
0 R  z5 P/ P, m. [$ L/ J数据库,成为率先突围的关键技术。6 a5 E% e6 l6 s; ]) q' E6 C( X
文 | 华商韬略 熊剑辉
( ~) z  T: J% g  X/ M" u4 R4 l2023年“两会”期间,最新组建的“国家数据局”,引发了人们的特别关注。
, N% i+ K$ V6 k- v1 ?! k( R有人认为,它的成立意味着“数字中国”将进入快车道;更有人认定,以数据库技术为核心的数据安全领域,有望迎来“大提速”。) @' T' t7 x4 x- d; R7 ]
显然,中国数据库正迈出“关键一步”。
0 [8 `3 n2 k2 z( r) Y【从集中式到分布式 数据库革命悄然爆发】
' o# r8 p' q  j& k: {1 ~4 `$ w- j作为数字经济的“根技术”,数据库的重要性不亚于芯片。
5 b3 U. p; G  |& E一切数据,都必须在数据库中奔跑。
; }, N' V% r- X# K0 M! O# b" A. N人们每天社交、餐饮、游戏、支付、打车等日常活动,离不开各种各样的程序应用。它们的背后,都离不开数据库。/ d1 O7 {3 @: ]1 W
而数据库技术的诞生与发展,即便顺应了时代的召唤,也充满了斗争与艰辛。/ c. X2 f8 s3 x& E, a+ X2 g
上世纪70年代,IBM的天才研究员科德,率先提出关系型数据库的理论、模型,甚至把查询语言SQL也琢磨了出来。6 t4 b. M; X: y3 N0 F% S8 s
但当时的“蓝色巨人”,沉浸在大型计算机巨大的商业成功里,对数据库软件兴趣寥寥。
" m; Y$ l" ?& _9 f结果,“硅谷大忽悠”拉里·埃里森,抓住了逆天改命的机会。$ R5 G) U. \$ ?
% M2 f, _% ~1 Z6 k% }8 n
" @- y# i5 N  C% V: \+ d2 `
  q/ y; D+ k- l3 r8 ~% Y2 b
他认真研究了科德的论文,觉得极富商业价值,并在1977年创立了数据库公司甲骨文(Oracle)。早期的Oracle相当不靠谱,但在埃里森的巧舌如簧下,美国海军、中情局、国家航天局等一帮“冤大头”,依然为Oracle买了单。
/ B# v% B) m" [! w1 j) i$ I8 Y0 |7 k" @$ t7 a3 j
▲1977年中国第一届数据库年会/ c  w# W1 O: Z, I
0 v# U% \5 I( \. w7 `9 c. o. |& w
彼时,神州大地万物复苏,中国计算机学会敏锐把握到了科技的脉搏,在黄山召开了第一届数据库年会。' _; @' R* e" v" H# A  \. E
可惜的是,这个时代中国的数据库技术,始终囿于高校和科研机构里。% v! m4 f. n+ N& Q: l
但拿到“第一桶金”的甲骨文,很快走上了正轨。/ R) X( t: R. {3 c9 {; i
80年代,美国数据库市场迎来井喷,甲骨文的Oracle、IBM的DB2、微软的SQLServer等,如雨后春笋般冒了出来。
0 n. ]7 P% W! K1 O" o  q/ f; h产业的风口,让甲骨文迎来了发展的春天。它不但创造了连续12 年销售翻番的奇迹,成长为全球第二大软件公司;连埃里森本人也一度问鼎“硅谷首富”,与比尔·盖茨不相伯仲。
) i" F* }, R4 M' X不过1996年,诞生在瑞典的免费数据库MySQL,给巨头们带来了一丝挑战。但在霸主甲骨文坚持不懈的猎杀下,2009年MySQL也臣服在甲骨文麾下。: S9 u8 n0 o7 `2 X: [9 i/ u1 H
美国的数据库产业在高歌猛进,中国的数据库技术却尘封在象牙塔里。结果90年代,当甲骨文们来到中国,基本是大杀四方的状态。6 C' v) M. l$ ?' c
1995年,邮电部提出“九七工程”,使得国内第一批数据库企业有了发展的土壤,在少数大学和国家机关得到应用。
. p& {. p6 X- {6 g; V6 ~1 [# ]3 X但最终,还是甲骨文乘着工程的东风,接连拿下东北邮电、中国电信等超级大单。( p# \& h- ]( }# \
至此,中国的金融、电信、航空等领域,逐渐被“IOE”(即IBM的小型机、Oracle的数据库、EMC的存储设备)横扫。
: r5 i8 d8 R2 X! D) [: D; T据全国人大代表、合肥工业大学应用数学所所长檀结庆调研统计,2020年之前,甲骨文、IBM、微软等巨头把持了87.7%的全球份额,处于绝对垄断地位。9 b& v* n# i( E  I/ ^
关系型数据库统治全球40余年,成就了甲骨文们的黄金时代。7 t, s, f0 r$ g' M% D
7 A$ C7 D- D5 ^4 n$ B
$ j* [& {; e" Y& J: t0 W7 Y. c( K

. x- {, D. z/ V+ i1 S- W- h但2008年,时代的洪流突然急转,NoSQL(非关系型数据库)诞生了。
# y- u! n+ o4 |3 V2 O1 P4 |驱动这场变革的,是亚马逊、阿里等互联网电商的崛起。* n! X3 ^% e8 p1 j9 T6 l
2009年,淘宝跃升为Oracle全球居前的超级应用集群。但集群的CPU跑得冒了烟,依然抵挡不住“双十一”的超级洪流。  ~  o" ]! G' }3 L, b: u/ \
与此同时,通信技术不断向3G、4G、5G演进,让图片、语音、视频等非结构化数据,呈现指数级规模的暴涨。
$ Y0 T1 y2 q" p2 s: m8 @战无不胜的Oracle,怎么就扛不住了?这来自于关系型数据库和非关系型数据库的区别。2 [) u$ O7 e  i! Q. {
我们可以把关系型数据库,看成一家“火锅店”。在Oracle支持下,它每天能招待1000位客人,很不错了。" _' \# d: B0 o+ P- o
但现在,店里突然涌进了1000万客人。他们不但要吃火锅,还要泡温泉、做美甲、放烟花、坐过山车……
/ _- y8 B% b' @2 ]在天量的、爆发式增长的非结构化数据面前,传统的关系型数据库的天花板被冲破了。
( a5 ~% u. f5 Q' B+ L$ X% |“火锅店”,必须升级成云端的超级“游乐场”。; D1 C4 k9 c, {5 K" ]
于是,一场由关系型向非关系型、由集中式向分布式转型的数据库革命,爆发了!
0 s" L" U& Z6 \, z( v4 z在分布式数据库的世界里,数据库不会再集中于单机或一地,而会将查询、存储、事务管理等核心功能,扩展到多机或多地。
. R* |: l% B. N, K0 ?于是,200万人在A区吃火锅,300万人在B区泡温泉,400万人在C区做美甲……
5 L! @) A) m. o另外,云计算还能通过存算分离、弹性分配等手段,打破资源瓶颈,让分布式数据库自由伸缩、无限扩展。5 o; G5 V* A/ E0 i# p2 @
也就是说,哪怕“游乐场”突然闯进1亿人,分布式数据库“遇强更强”,照样能铺开。
: U9 t) \) V! o这是传统的关系型数据库,根本无法比拟的。) d7 b3 o: b: H% P  V" H
因此在Gartner看来,云化、分布式数据库将主导未来,引领数据库技术的新趋势。预计2023年,75%的数据库会运行在云端;2024 年,全球数据库市场规模突破千亿美元,分布式数据库将成为最主要的市场增量。+ D- I6 W1 `1 x
如今,再造一个Oracle,做不到也没必要。云化、分布式数据库,成为中国数据库“换道超车”的唯一机会。
9 {  n- w' x6 t/ C: l. o$ V【率先破局的关键技术 造就数据库断代史】
. `0 U. ]# Q/ ]1 Q9 Q6 K5 Z$ {机会永远属于敢于破局的人。4 `+ g/ ^# R, p8 x+ i
2022年4月,中国邮政储蓄银行(以下简称“邮储银行”)的新一代个人业务分布式核心系统成功上线。* a7 k# t: F& S" G3 g# T2 _
这一出手,就建成了全球最大的银行分布式新核心系统。其中,华为云GaussDB功不可没。9 E8 P7 l: e& X1 y( Q
众所周知,核心系统是银行的“大脑”和“心脏”,不但承担至关重要的任务,而且在亿万次存储、计算中不容丝毫闪失。9 \1 m. m. z' r: A4 G
以往,这是只有Oracle才能染指的“禁区”。
1 R& c3 |- }. h邮储银行的老核心系统,使用的正是关系型、集中式Oracle数据库。但伴随金融服务在线化,交易频次越来越高,容量瓶颈、性能支撑、业务负载的挑战越来越大。一旦碰到交易高峰,系统资源缺乏弹性,拥堵成了家常便饭,严重影响用户体验。
7 z( R; p1 N% U4 r9 F如今,以华为云GaussDB等为代表的中国分布式数据库打破了这个“铁律”。" _) {( C% i& t% o! X' F
新系统上线后,邮储银行一举实现日均20亿笔、峰值6.7万笔/秒的超强交易处理能力。即便面对6.5亿客户、4万多个网点的数据冲击,依然游刃有余。9 W2 }+ J, m4 E8 A
全天联机平均耗时从93毫秒减少到65毫秒,批处理时间从4.5小时缩短到3小时,较老核心系统提升30%以上性能。
, F% e; ~0 ]$ s  ]2022年三季度,邮储银行迎来结息大考。过去耗时140分钟的任务,新核心系统仅用25分钟完成,性能、效率大幅提升,充分验证了中国数据库在安全可控上的承载能力。& ?( u9 ]; j  ]8 \# F* p) O
实际上,在海量数据、任务并发的情况下,要实现数据处理“不出错”,是一件非常非常困难的事情。
# I/ f$ t) \: T% z& Q# h7 W1 m+ X这就像在1000万人涌动的“游乐场”里,要求游客不踩掉鞋、不走丢人、不传错菜。
& B- P& k# s" ~2 r) f听起来,这是一个几乎不可能完成的任务。* V3 C" Z8 R- f/ S4 `8 u/ I4 C
但在银行、电信、电力、航空等系统中,就是苛求“不出错”、“稳定压倒一切”。" Q4 @; w/ U( p3 d
华为云GaussDB做到了。+ l  x' f7 p) Q0 q
) f. Q. @( z% d& i  u& i
. \1 c& u0 c. Q) \9 M8 y
5 l3 ?/ q+ t3 G8 c+ Q: ^
2022年,中国首个数据库行业最高安全认证-国际CC EAL4+,花落GaussDB;同年,高分通过北京国家金融科技认证中心的“分布式数据库金融标准验证”测试。3 v: D! c: o) W' K' H, B6 ~
与此同时,GaussDB再次通过中国信通院防篡改、智能化、分布式事务基础能力三大专项严苛评测。: @* M6 }& ^2 p4 p- o
所谓防篡改,就是在极端情况下,数据库依然要具备识别风险、防止篡改、备份还原的能力。+ \+ U* t4 g# h! q% k. V$ P
所谓智能化,就是数据库不但要提供智能运维,而且通过趋势预测算法,帮管理者智能决策、推理预警,让系统更加安全可靠。
; _5 j0 N8 l5 T* c  t所谓分布式事务型数据库基础能力,就是一旦出现大规模数据需求,数据库要能迅速反应,就近调集分布式的CPU、内存、存储等系统资源,高效处理海量数据的能力。
( o- a( k9 T$ \7 T. M* ^如此强悍实力的背后,则是华为云GaussDB在全球范围内累计获得的700多件专利,在提供有力的支撑。" g' F3 ^, `1 m* p! }4 R" F
即便在数据库综合要求最严苛的金融业,GaussDB在包括工商银行、邮储银行、建设银行、华夏银行等规模落地,以及拥有永安保险、甘肃医保、一汽集团等重点行业客户。
) V6 X& n+ B0 Q5 N! R7 n华为云GaussDB的崛起,同步带动了中国自研数据库影响力的提升。) l+ P" H7 w5 d# D$ S0 }5 \* e
IDC发布的《2021年上半年中国关系型数据库软件市场跟踪报告》显示,在传统部署模式市场中,华为、阿里、达梦、人大金仓的市占率,分别为14.7%、5.7%、5.7%、5.0%。
( E" J7 q. T7 w
5 p: w9 }: ?, W) u/ x1 {* N  C; B6 n- X$ {2 E
2 _' n: _! h  v6 A: F2 ]) G
在IDC最新发布的《2022年上半年中国关系型数据库软件市场跟踪报告》中,在本地部署模式市场中,华为云数据库凭借GaussDB以16.59%的份额排名国内第一。自2020H1以来,GaussDB已经连续五次蝉联第一,在国内关系型数据库市场持续领跑。
9 e0 Y& x( H0 ~: S, L- v今天,中国的分布式数据库正趋于成熟,获得市场认可。只要假以时日,就有望在时代的大潮中崛起。
. i! U" o, C5 }6 j5 w: }, b+ F' B0 p【积于跬步,方能行至千里】
& {: e- V5 p( W) a# C( _数字时代的蓬勃发展,也将中国的分布式数据库不断推向前台。
8 |5 A& \  V8 o6 x/ }3 JIDC数据显示,全球每年的数据量呈现爆发式增长,预计从2018年的33ZB增至2025年的175ZB。: m8 ?- v' a# P# o2 e& o2 V: p- x5 s
中国的数据量增速更领跑全球,预计从2018 年的7.6ZB猛增至2025年的48.6ZB。) e+ b4 P: E/ }9 ~& C
数据的计算载体,早就从大型机、小型机、PC,演变成云、边、端的联网计算,高并发、低时延的交互计算。  Y3 z$ W' `3 v  m# _
面对这样的未来,华为云GaussDB早有准备。
3 g, m, ~6 g) j  X0 c' Z比如,大部分云数据库,只能在数据的传输态、存储态中进行加密。4 _; D. \) b4 G4 A$ |1 A; S/ \
而华为云GaussDB却实现在内存中的运算态加密,从而成为业界第一款纯软全密态的数据库,实现了对数据全生命周期的完整保护。( u) z# p- X3 f& `, Q$ j
) e5 e4 N& N' F; l

$ x5 N6 b2 Y* U3 ]  c5 l1 o0 d/ ]- O  f6 C. K: O% t0 q  K
另外,在原生分布式数据库领域,中国数据库也更顺应企业的诉求和发展的趋势。
' [# O" I+ c1 }5 c( O比如有的互联网企业,坐拥海量数据,极易患上数据库性能不足“恐惧症”。
: o9 y4 D- Y, o# t( a" H3 r但华为云GaussDB,直接打通了软硬件“任督二脉”,将数据库性能发挥到极致。
$ j6 v0 C; h9 R4 X# c  z, S硬件上,GaussDB拥有鲲鹏处理器的多线程、原子指令、SCM的字节寻址持久化等能力;软件上,又实现了动态编译、SQL By Pass等。
9 a; V# g: C) k; w于是,基于鲲鹏两路服务器,GaussDB 32节点处理能力达到了惊人的1500万tpmC(即每分钟系统处理新订单个数),百亿数据量查询“秒级响应”。
8 z' |9 W8 `4 ?* k/ n. P有的企业,依然对数据迁移心存顾虑,担心到最后才发现数据库不合适。9 k9 e& y, d5 D8 n  L
对此,GaussDB开发出一系列强悍的迁移工具。如数据库迁移工具UGO,实现了异构数据库对象和应用迁移,语法转化率达90%以上;数据在线迁移工具DRS,可实现数据的在线迁移、数据校验。
4 w4 ]9 s# z& S8 ]' o  y$ m此外,由于是“自己人”,GaussDB完全能够为企业量身打造“数据库架构+应用+数据”一体化的迁移方案。
7 T- u# h2 F& P3 a这才是以华为云GaussDB为代表的中国数据库真正的机遇所在。- m! V' d+ ?+ t$ i8 S) B# B) g
而伴随大国崛起,国人对中国数据库更应该抱有一种开阔、包容、自信的气度。
7 C. |6 F5 [) W: G因为历史证明,好数据库是用出来的。
+ |, c- y3 i( T% R" y# w1978年,Oracle在美国第二次石油危机引发的“滞胀”下诞生,草创之初Bug频出、骂声一片。美国海军、CIA、NASA硬是顶着“被骗”的压力,让Oracle闯过了生死关。( C, p. a& M+ @& e. w; G6 t
此后,又经过全球用户40多年不断的实践、反馈、打磨、培训,Oracle才拥有了成熟、稳定的口碑。
! i" i  a. E# G; \. x显然,中国数据库不可能一夜成熟,也必然要经历漫长打磨的过程。但只要今天播下宽容、创新的种,对襁褓中的中国数据库多采购、多使用、多呵护,明天才能收获卓越、成熟的果。
6 C# T, D( y. s8 ]1 s! [积于跬步,方能行至千里。
+ [2 r8 }# x% m- {* n在新一轮科技革命的大潮中,这条漫漫长路显然才刚刚开始。
* s7 z$ b& ~6 U7 q, n欢迎关注【华商韬略】,识风云人物,读韬略传奇。( `. c; E/ E  L2 |
版权所有,禁止私自转载
- K% W' [3 X. ]" Z部分图片来源于网络- l4 T/ g( e9 G3 v5 l) B! S8 u
如涉及侵权,请联系删除
, A8 g) }/ O, B% o5 `- n

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

帖子地址: 

梦想之都-俊月星空 优酷自频道欢迎您 http://i.youku.com/zhaojun917
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /6 下一条

QQ|手机版|小黑屋|梦想之都-俊月星空 ( 粤ICP备18056059号 )|网站地图

GMT+8, 2025-8-14 19:22 , Processed in 0.037597 second(s), 24 queries .

Powered by Mxzdjyxk! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表