阿里数据库自研
㈠ 一场替换传统数据库的行动正在全球范围悄然进行
随着全球各大 科技 巨头的竞相加入,开源软件技术已经活跃在各个信息技术领域当中。其中,大数据生态成为开源技术的直接受益者。开源技术适用于庞杂的数据管理系统,带来敏捷、高效、可扩展以及可自控的管理能力,并帮助企业降低IT建设及维护成本。2018年双11当天,阿里云原生数据库PolarDB轻松应对了0点0分0秒瞬时提升122倍的数据洪峰。Netflix也采用自研开源架构Metacat将海量数据集合成一个“单一”的数据仓库,大幅提升管理能效。
当前,我国有越来越多的企业、人才加入到开源社区,贡献力也“后来居上”,共同推进开源项目、开源生态的繁荣和可持续发展。
大数据生态成为开源技术重大“受益者”
近年来,在互联网服务、多媒体以及科学研究等多个领域,都可见到大数据的身影。在大数据时代,不断增长的数据量、快速处理数据的需求以及数据类型、结构和来源的多样性给数据库敏捷、高效、可扩展性以及个性化管理带来了全新挑战。
开源技术赋能了大数据生态的高质量发展。赛迪智库信息化和软件服务业所博士蒲松涛表示,经过了数十年的发展,开源软件和开源工具已经应用到了大数据产业发展的各个环节,基于开源软件,企业可以快速构建大数据应用平台,提供丰富的大数据开发和应用工具。
当前,几乎各种规模的企业都在使用开源软件和工具做大数据处理和基于数据的预测分析。开源界也涌现出了Hadoop、OpenStack、OpenShift、Maprece、docker等引领行业技术创新方向的重量级开源项目。
华泰人寿基于OpenShift架构打造易于管理的新IT系统,以提升企业竞争力,实现业务数字化转型。在基础设施上,引入红帽OpenShift容器云解决方案和红帽Ceph分布式存储。通过将保险业务上docker云,实现华泰人寿业务的弹性伸缩和快速上线,加速其互联网保险项目快速落地。
美国知名在线影片租赁提供商Netflix也采用了大数据发现服务的开源框架Metacat。由于Netflix的数据仓库由许多大型的数据集组成,为了确保数据平台能够横跨这些数据集成为一个“单一”的数据仓库,Netflix开发的元数据服务Metacat,能让数据的发生、发现、处理和管理变得更加快捷高效、处理精度大幅提升;同时还可兼容Spark、Presto、Pig和Hive架构。Netflix软件架构师Ajoy Majumdar指出,开放开源是身为技术公司的竞争战略,既能够将自己的解决方案建立为行业标准和最佳实践,又能建立Netflix的技术品牌,还能从共享生态中获得反馈输入并受益。
事实上,推动大数据应用高质量发展的主流开源平台还有很多,例如Spark、Shark、Bagel等。蒲松涛表示,这些开源平台大幅降低应用门槛,有效帮助企业实现工业级应用,进而带动各行业大规模部署。此外,大数据还涌现出了一批开源支线平台。其中,Storm完全摆脱了经典的MapRece架构,重新设计了一个适用于流式计算的架构,以数据流为驱动触发计算,计算时效性高,适应有向无环图计算拓扑的设计,计算方式较为灵活,在业界得到了一定的部署应用。
开源社区供需“双赢”中国力量已崛起
开源社区的建立为推动开源软件发展、构建行业竞争优势做出突出贡献,队伍的壮大需要每一位使用者持续不断的贡献智慧,以实现真正的“共赢”。开源的发展历程中,极客、大公司、商业颠覆者轮番登场,开源技术的诉求也从商业驱动向生态驱动发展。中国工程院院士廖湘科指出,开源是软件创新技术的主要来源,是生态抓手,而非赢利的切入点。
开源软件的“共享和贡献”机制吸引了众多开发者的参与,给了每一位开发者“颠覆 游戏 规则”的权利。有了这种生态的加持,信息技术将被快速推进,各个参与者将持续获利。对此,李飞飞表示,开源生态的受益者是开源技术的需求侧和供给侧双方。从供给侧角度来看,参与的人越多,思维碰撞而引发的迭代演进就会越快;从需求侧角度来看,各个企业不仅可以免除被闭源系统“技术绑定”,还可以在开源社区实现数据库技术迁移,企业还可针对企业技术特征进行数据库的个性定制化,实现大量的应用和代码的改造且系统间互相兼容。
中国开源软件推进联盟副 主席 兼秘书长刘澎在Postgresql .CN 2019上表示,当前国内越来越多的企业为开源做出重要贡献,我国的开源实力已经崛起。以华为、阿里等为代表的开源软件开发者已经逐渐与亚马逊、微软站到了同一高度,实现了从“使用者”到“引领者”的身份转变。
目前,中国企业在Linux基金会中有1个白金会员(华为),1个金牌会员(阿里云)和数十家银牌会员(包括腾讯、中国移动、联想等)。华为在多个开源社区贡献排名前列。中国工程院院士倪光南认为,华为是开源软件的优秀开发代表,通过引进、消化,实现创新发展,进而贡献给整个开源社区。
阿里云也成为 游戏 规则的重要改变者和全球云数据库领跑者之一。2018年,阿里云数据库成功进入Gartner数据库魔力象限,这是该榜单首次出现中国公司。近日,Gartner发布的全球云数据库市场份额榜单中,阿里云位居第三,超越了Oracle、IBM和谷歌。5月21日,阿里云提供传统数据库一键迁移上云能力,可以帮助企业将线下的MySQL、PostgreSQL和Oracle等数据库轻松上云,最快数小时内迁移完成。李飞飞表示,阿里云自研的PolarDB云原生数据库的分布式存储架构具有一写多度、计算与存储分离等优势,帮助淘宝交易平台应对了双11当天瞬时提升122倍的数据洪峰。
此外,国内还有包括网络、浪潮、瀚高等在内的众多企业积极参与并贡献到开源社区当中。人工智能、自动驾驶等新兴信息技术也成为开源项目的重要应用领域。
㈡ 如何看待 openGauss 坚持开源开放,打造面向数字基础设施的开源数据库的行为
在国产数据库技术发展的初级探索阶段,技术是关键,而在当下的快速发展阶段,生态就成为最重要的一环。
开源是形成初步版本、扩大开发者和用户群体、增强技术影响里的重要一环。开源是对生态的动态推进。
openGauss(2020年6月30日开源)在2019年9 月 19 日,在华为 CONNECT 大会上,华为宣布将开源其 GaussDB 数据库,开源后的产品被命名为 openGauss,这也是openGauss的“open”开头的由来。
2020年10月12日发布第一个正式公开版本——openGauss 1.0.1版本,2021年10月发布openGauss 2.1.0版本。一款开源关系型数据库管理系统,采用客户端/服务器,单进程多线程架构,支持单机和一主多备部署方式,备机可读,支持双机高可用和读扩展。采用木兰宽松许可证v2发行。2022年4月1号,3.0版本正式发布。openGauss内核源自PostgreSQL,深度融合华为在数据库领域多年的经验,结合企业级场景需求,持续构建竞争力特性。
另外:OceanBase(2021年6月1号开源)阿里和蚂蚁集团开源的数据库,是完全自研的分布式关系数据库
TiDB(2015年4月开源)PingCAP 公司自主设计、研发的开源分布式关系型数据库,一款同时支持在线事务处理与在线分析处理的融合型分布式数据库产品。
㈢ 阿里平头哥宣布,自研处理器已成功落地,它的性能如何
阿里巴巴宣布旗下的平头哥半导体完成了安卓10对RISC-V的移植并开源了全部相关代码。从平头哥社区发布的信息来看,安卓10系统已经可以在玄铁910芯片上流畅运行。至于玄铁910,则是前年阿里巴巴旗下的平头哥半导体发布的一款号称是业界最强的RISC-V处理器内核IP。资料显示,玄铁910单核性能达到7.1 Coremark/MHz,主频达到2.5GHz,比当时业界最好的RISC-V处理器性能高40%以上。据介绍,玄铁910可以用于设计制造高性能端上芯片,应用于5G、人工智能以及自动驾驶等领域。
㈣ 阿里云rds数据库是自主研发的吗
一般rds习惯性指mysql数据库实例,但其实也包含sqlserver。这两种数据库一个是开源的,一个是微软的,都不算是阿里研发的数据库。
华为云 rds-gaussdb系列都是自主研发的。
㈤ 阿里巴巴采用自己研发的分布式数据库系统叫什么,它有哪些特点
上层的是分布式数据库分表分库中间件,负责和上层应用打交道,对应用可表现为一个独立的数据库,而屏蔽底层复杂的系统细节。分布式数据库中间件除了基本的分表分库功能,还可以丰富一下,比如讲读写分离或者水平扩容功能集成在一起,或者比如读写分离本身也可以作为一个独立的中间件。(Cobar, MyCAT, TDDL, DRDS, DDB)
增量数据订阅和消费,用户对数据库操作,比如DML, DCL, DDL等,这些操作会产生增量数据,下层应用可以通过监测这些增量数据进行相应的处理。典型代表Canal,根据MySQL的binlog实现。也有针对Oracle(redolog)的增量数据订阅与消费的中间件。(Canal, Erosa)
数据库同步中间件涉及数据库之间的同步操作,可以实现跨(同)机房同步以及异地容灾备份、分流等功能。可以涉及多种数据库,处理之后的数据也可以以多种形式存储。(Otter, JingoBus, DRC)
数据库与数据库之间会有数据迁移(同步)的动作,同款数据同步原理比较简单,比如MySQL主备同步,只要在数据库层进行相应的配置既可,但是跨数据库同步就比较复杂了,比如Oracle->MySQL. 数据迁移一般包括三个步骤:全量复制,将原数据库的数据全量迁移到新数据库,在这迁移的过程中也会有新的数据产生;增量同步,对新产生的数据进行同步,并持续一段时间以保证数据同步;原库停写,切换新库。将“跨数据库”这个含义扩大一下——“跨数据源”,比如HDFS, HBase, FTP等都可以相互同步。(yugong, DataX)
㈥ OceanBase那么厉害,为什么不去和Oracle竞争,抢占企业市场的市场份额
因为干不过 吹出来的 给不懂的人看而已 1500多个节点的分布式架构和人家10年前27节点rac比!别忘了你用的ssd 人家还是机械盘!
阿里巴巴旗下的数据库OceanBase屡屡在国际上获得数据库竞赛大奖,不少人就要问了,既然OceanBase这么厉害,为什么阿里巴巴不去抢占Oracle的市场份额呢?
OceanBase竞赛结果有片面性、功能还不够完善事实上在阿里系内部,也只有蚂蚁金服是真正在大规模使用,在阿里系内部其他团队已经有三大数据库,X-DB是阿里集团数据库团队搞的,PolarDB是阿里云团队、也就是李飞飞博士负责的,OceanBase是蚂蚁金服数据库团队搞的,现在阿里内部已经推进了X-DB和PolarDB的全面融合,李飞飞博士领导的PolarDB团队将会立足长远,是下一代数据库系统,未来阿里云的业务有多广,PolarDB要面对的业务场景就有多复杂。
OceanBase最大的优势在于这是阿里真正完全自研的数据库,跟阿里云一样,是从头到尾完全自研的,当然这个完全自研到底到底有没有水分我们并不知道。大家了解OceanBase就是之前的打比赛,不过OceanBase占了分布式的光,吃了硬件的便宜,加上最近十年Oracle已经不来打比赛了,阿里本质上是跟十年前的Oracle在比,软硬件技术都不在同一个起点上,这也是这个竞赛结果有很大片面性的根本原因。在单机性能方面,Oracle依然要更强一些,稳定性就更不用说了,Oracle已经稳定运行了这么多年。
OceanBase之所以还没办法跟Oracle竞争,是因为OceanBase还没有那么强,也还有非常多需要完善的地方,功能上还有很多不足,在阿里内部数据库分化也还比较明显,OceanBase在跟另外的产品竞争当也,没有优势。
OceanBase“专属性”明显、开源后闭源,企业要稳定、企业也不都是阿里OceanBase更多的还是围绕蚂蚁金服自己的业务在做,现在除了阿里系内部在使用,真正的商业化用户也就只有PICC、南京银行两个比较大,是在真正使用OceanBase,客户群体还太小太小,样本数量确实还不够大。
OceanBase之前其实是开源了的,不过后来又闭源了,在商业化过程中也遇到了一些问题,这个操作当时其实就吓到了很多人,OceanBase闭源之后的版本跟原来的差距非常大的。OceanBase更适合处理互联网业务,跟传统企业业务契合度并没有那么高,Oracle的很多功能OceanBase都还不具备,OceanBase的生态、工具、技术支持还差很多很多。oceanbase是为大规模事务处理准备的分布式系统,听起来很强大,但是真的不够接地气。
OceanBase针对阿里的业务进行了深度优化和定制,这就让OceanBase在通用性上有了很大的阻碍。可是在其他企业就很难的,阿里有很好的技术团队,他们也可以为了业务做出专门的调整,阿里有这样的能力和资源,但是小企业没有这样的配置,尤其是传统企业根本不可能做这样的事情。大家更希望系统是稳定好用的,拿过来就可以直接用的,你现在又不开源了,用户担心更大,还不如继续用稳定的Oracle数据库。
技术这东西吧我还是喜欢说句实话,不是你自己说你有多厉害就真的多厉害,还得是实际场景的应用才行。就像网络一样,好像这些年大家也不吹网络了,但是春晚一战,网络成为唯一一个扛住了春晚流量洪峰的企业,技术实力业内人都看得明白。OceanBase做得很好,但是也没有那么好,至少是目前应用还没有那么好。
早就在竞争了!
实际上阿里云的OceanBase数据库系统在推出以后,实际上就已经开始商业化运作了,就在不断的从甲骨文公司手里面抢到更多的企业级应用市场了。
OceanBase确实很先进近日,在数据库领域内,OceanBase数据库又打破了世界记录,直接创造了7.07亿TPMC的新世界记录。
从OceanBase的功能和速度来看,现在OceanBase是世界领先的数据库产品,在被誉为“数据库领域世界杯”的国际权威TPC-C测试中,OceanBase性能分数打破Oracle多年垄断,不断创造新的世界记录。
而且OceanBase采用新一代分布式处理技术,颠覆了传统数据库集中式技术架构,尤其适应了互联网持续扩张的数据处理需求。
正是OceanBase数据库的可扩容的特点,也降低了用户的使用成本,而且又拥有很高的速度,因此,现在OceanBase在企业市场中的份额是越来越大了。
现在阿里云市场份额很大阿里云市场份额不断扩大。根据国际研究机构Gartner发布最新云计算市场追踪数据,阿里云亚太市场排名第一,全球市场排名第三。在全球市场份额中,阿里云仅次于美国的亚马逊和微软公司。
阿里云从2018年到2019年,在全球市场份额从7.7%上涨至9.1%,进一步拉开与第四名谷歌差距,挤占了不少亚马逊的份额。而在亚太市场,阿里云的份额更大,从2018年的26%上涨至2019年的28%,接近亚马逊和微软公司的总和。
现在阿里云的服务其中一项最重要的就是数据库的服务,也就是OceanBase数据库的服务。
实际上,从2015年,OceanBase数据库推出以后,淘宝和支付宝系统就开始了去IOE,开始上云,然后好多银行的金融服务也开始去IOE,上云。这些实际上都是开始抛弃甲骨文数据库系统了。到现在为止,通过上云使用OceanBase数据库数据库的企业和公司就更多了。
结论综上所述,OceanBase数据库早就在跟甲骨文公司进行竞争了,现在阿里云的份额在全球排在第三名,阿里云其中最关键的应用就是OceanBase数据库的应用了。
OceanBase其对标的是亚马逊的Aurora,你要目前去和Oracle竞争,这个目前还不对等。
OceanBase满打满算10年的时间,Oracle呢,40多年了。目前大的企业,像银行、电信这些核心企业,基本上是Oracle的天下,也有Sybase、DB2、SQLServer。其实还是那几个巨头在玩,甲骨文、微软、IBM、SAP,这些可都是企业服务领域的巨头。
听到DB2(IBM)是不是有人觉得老土了,但是现实就是还有很多系统在用,为什么呢?因为有些系统要切换数据库,估计要出大问题。
互联网公司反而在这方面投入不高,那就用像MySQL这种开源的,最先MySQL被SUN公司收购了,现在SUN又被Oracle收购了,所以还是Oracle旗下的。
Oracle之所以这么强势,就是因为其产品的稳定性,尤其是金融类机构,一点数据问题都不能出,否则你银行里只有100块,花出去了101块,这个问题就大了。你可以想下,几十年,遍布全球的金融类机构,大部分只敢用Oracle,就是因为产品稳定。而且这么长时间的技术积累,问题解决经验,这个真的不是说自研就解决的。
伴随着云服务的大趋势,几个主要的云服务提供商,亚马逊、阿里、腾讯都在发力数据库,像淘宝、微信这种大的国内应用,本身必然会要求其数据库团队越来越强大。
OceanBase其实也在慢慢的搬运Oracle的客户,但是这个急不得。其实在市场定位上,国内的大量互联网公司并没有使用Oracle,因为太贵了。所以这部分客户才是OceanBase的主要目标。
Oracle代表的是云服务以前的顶峰,而且目前看想替换不是几年的事情。新的OceanBase伴随着云服务的扩展,必然一步步的能取得更多的市场份额。阿里云发展必然能带动OceanBase的快速发展。
慢慢来吧,数据要的是稳定。
第一,oceanbase是否比Oracle强并不能完全肯定,Oracle这么多年的发展形成了完整的生态,让大多数人熟悉了他那一套,oceanbase应该说在一些场景下比Oracle强,尤其分布式方面,因为他这方面在自身业务驱动下更加突出。
第二,Oracle的客户基本上是规模型企业,且一般用于核心业务系统上,切换成本很大,风险很大,做这样的决策是非常困难的。
第三,人才培养没有那么快,切换oceanbase没有多少人会,培训学习和运营管理都需要时间
第四,阿里发展重心不是这种产品销售模式,Oracle这种模式需要大量的营销团队和服务支持团队
第五,阿里时机还未到,先通过云服务不断发展客户完善产品,后期根据自身的发展策略可能会决定面向客户销售
银行 金融 政府等行业是不会去尝试新技术的 他们要的是稳定 可靠 打个比方 银行每天流水 1个亿 用新系统 花钱了 而且出了问题 损失了 谁负责?!花钱不讨好!银行也不差那点软件版权费!
应用场景差别很大,分布式系统维护成本很高。这和外国宁愿买二手F16,也不愿意采购歼10一样,更何况,OB确实还不如Oracle。
但是现阶段贸易战,已经消除了Oracle的空间,正是OB等系统的机会
如你所愿。
oceanbase最近独立运营了,开始发力推广。先把TPC-C基准测试排名达到世界第一。(第二也是自己,这次是二刷)
然后最近刚刚开源。把300万核心代码都开源出来。大家可到github上查看。
金融领域继续发力。和合作伙伴一起做去O。尽量能兼容Oracle,让客户无损切换到oceanbase上来。
相信不远的将来,中国企业都能用上国产高性能数据库。
㈦ 对话阿里云李飞飞:关于云原生数据库的五大预判
作者:王慧贤
数据存储、数据分析、数据安全......如今,围绕“数据”的话题越来越多,离人们的生活也越来越近。
从陌生到熟悉,数据不仅“出圈”,甚至已然站在了C位。去年,中央发布的《关于构建更加完善的要素市场化配置体制机制的意见》中明确表示,继土地、劳动力、资本、技术后,数据成为第五大生产要素。
步入信息化时代后,数据库、操作系统与中间件作为计算机最基础的三大软件,支撑着企业的正常运行。
当数据成为生产要素后,必然会迎来爆发式增长,企业的数据存储和处理需求将进一步释放。更重要的是,疫情加快了数字化转型的脚步,更加速了企业的上云速度。
从信息化到数字化,时代的变革,总会带来商业世界的变化。如何在云原生架构下使用数据库,成为企业的痛点和云厂商的机会,亚马逊AWS的CTO Werner Vogels曾多次强调:“数据库是云计算的终极之战。”
在数智化时代,云原生到底意味着什么?云原生数据库和传统数据库相比,核心优势是什么?是否把数据库搬上云就是云原生?基于这些问题,雷锋网与阿里巴巴集团副总裁、阿里云数据库产品事业部负责人李飞飞展开一场对话。
国产云原生数据库,摆脱“切肤之痛”
如今,数据库的商业世界,因为云的出现与发展,分成了两大派系。
一派是以Oracle为代表的传统商用数据库,一派是以国外AWS、国内阿里云为代表的云原生数据库,去“IOE革命”下的产物。
其实,早期较为火热的数据库种类有三种,层次式数据库、网络式数据库和关系型数据库。
在《浪潮之巅》一书中,作者吴军写下了这样的观点:“Oracle 的兴起很大程度上靠的是它最早看到关系型数据库的市场前景,并且在商业模式上优于 IBM。”
因此,在云原生数据库“入世”之前,数据库的天下一直是Oracle的,国内大部分互联网公司都不得不采用Oracle+IBM小型机+EMC的模式来维持正常运营。
高昂的费用,使得对于数据库需求较大的互联网巨头“忍无可忍”。
2009年,阿里巴巴的Oracle RAC 集群节点数达到了创记录的20个。可由于Oracle并没有弹性扩展的功能,只能按照峰值流量购买小型机和数据库,导致阿里将业务上涨带来的大部分利润,都支付给了Oracle。
第二年,阿里便开始走上了去“IOE”之路,根据开源MySQL搭建了AliSQL,并顺利经过了淘宝双11的考验,国产云原生数据库算是正式摆脱了“切肤之痛”,逐渐受到市场的真正认可。
另一边,国外的AWS在2015年公布了基于云计算的自研数据库Amazon Aurora。Aurora是一个关系型数据库,可以跨3个可用区域复制6份数据,其最大的特性就是高性能和高可用性。
云计算巨头的入局,让云原生数据库在国内外一步步成为主流。据Gartner预测,到了2021年,云数据库在整个数据库市场中的占比将首次达到50%,到2023年,75%的数据库都要跑在云平台之上。
关于云原生数据库,随着逐步的出圈,也让人们关心的焦点从“是啥?”转变为“还能解决哪些问题?”
但云原生数据库存在着数据孤岛的问题,无法打通多个数据系统的情况下,企业在数据加工和数据管理上就会“压力较大”,甚至在数据安全方面还存在隐患。
传统数据仓库一般基于T+1数据集成构建离线数仓,以支撑企业各项分析与服务。传统方案不但会影响线上业务稳定性,且难以支持企业的实时需求。
因此,在李飞飞看来,云原生数据库已经走到2.0阶段。这个阶段要解决的问题,就是上述存在的痛点。
9月26日,在阿里云数据库创新上云峰会上,阿里云发布了首个一站式敏捷数据仓库解决方案。该方案结合一站式数据管理平台DMS及云原生数据仓库AnalyticDB(简称:ADB),实现了库仓一体的技术架构,提供在线数据实时入仓、T+1周期性快照、按需建仓等能力,数据延时低至秒级,持续赋能业务在线化,使企业的在线数据可以释放出更大的价值。
相较于传统方案,阿里云一站式敏捷数据仓库解决方案有4大核心优势:
1、对业务侧影响小,不会因为数据汇聚集中和实时加工影响业务侧正常运行,CPU、内存占用低于5%;
2、事务顺序和数据准确性有保障,且处理链路短,支持在线数据实时处理落仓,效率更高。数据传输效率100m/s,数据延时在10秒内;
3、支持复杂实时数据加工、计算逻辑;
4、低代码操作,能够大大降低实时数仓的构建难度,提升构建效率的同时,支撑企业数字化转型过程中的各类实时场景。
除了实时统计分析场景外,企业为满足周期性数据分析需求,需建设周期性全量快照。
传统数仓的周期性全量集成方案会对生产业务造成稳定性影响、全量集成时效性差、且无法满足客户针对任意时间点进行数据回溯的业务诉求。
针对T+1周期性集成场景,一站式敏捷数据仓库解决方案支持基于拉链表的T+1全量数据快照,用户通过简单几个步骤,即可按需生成各种周期的全量或增量快照。
此外,业务还可按需进行任意时间点的数据回溯,以快速解决数据异常问题。
谈起未来数据库的发展趋势,李飞飞提到以下五点:
1、云原生+分布式一定是数据库的标配,分布式已经是必选项。分布式数据库由多个相互连接的数据库组合而成,面向用户则是以单个数据库的形态出现。云原生分布式数据库具备易用性、高扩展性、快速迭代、节约成本等特征,从资源池化到弹性扩展,再到智能运维,再到离在线一体化,解决企业用户的核心诉求。
2、AI for DB(database,指数据库)和 DB for AI 将是主流趋势。用AI将数据库运维管控智能化,尤其在云原生+分布式这个前提下更重要,因为数据库不仅是内核的能力弹性高可用、可拓展性,更重要的是部署后应用和运维的复杂度要大大降低。在数据库里,面对越来越多非结构化的数据,分析能力十分重要。
3、数据的安全可信,在今天这个大环境下变得愈发重要,如何确保整个数据库系统,在处理数据全链路过程中提供加密能力、多方安全计算能力、隐私保护的能力,也是很重要的趋势。
4、多模数据处理能力将越来越重要。比如,新型数据库多模态的处理能力,在新能源 汽车 企业打标签、智能电池化预测等应用场景中,将发挥越来越重要的作用。
5、一份数据,多个数据处理引擎:实现仓库一体、仓库联动、仓库打通,数据之间无缝流转。
以上判断,也从侧面反映出阿里云数据库的走向,这点毋庸置疑。但除此之外,业界最关心的,还有开源。
近半年,国内很多厂商相继提出开源战略,背后缘由显而易见,为了打造生态。就在今年的阿里云峰会上,阿里云智能总裁、达摩院院长张建锋(花名行癫)将2021年阿里云的发展关键词归纳为:做好服务、做深基础、做厚中台、做强生态。
做好服务与生态,成为如今厂商们不约而同的目标,而开源,就是最好的选择。
当雷锋网问到:“未来,阿里云数据库会不会把所有能力都开源?”这一问题时,李飞飞给到的回答是:“不会。”
之所以有这样的回答,是因为对于开源,他有着一些判断和看法。
李飞飞表示,这些部分,本就是阿里云数据库的商业化版本。
事实上,业界大多数的数据库厂商都不会针对自身的核心能力开源,如TiDB的核心管控组件、TiFlash。
与像MongoDB,、Cassandra、CouchDB这些以开源起家的数据库厂商不同,开源只是阿里云数据库的战略,不是阿里云数据库的命脉。
前几年,有业内人士表示,在面向开源时,国产数据库首先需要解决信任以及开源知识产权等问题。“开源会让厂商更加认真思考版权还有专利的问题,事实上,选择开源后,对于数据库厂商提出了更高的要求。”
李飞飞认为,开源只是一种选择,数据库开源成功并不代表着商业化就能够成功,不开源也不能代表厂商不先进。
更准确的说,开源只是一种有效手段。
最终,阿里云数据库希望客户能够通过开源版本把阿里云数据库产品技术快速用起来,并能够参与到技术产品的迭代过程中,在一些高阶能力上,借鉴团队专业能力和阿里云的服务能力,成为良好的商业合作伙伴,这是李飞飞以及阿里云数据库对于开源的一些基本思考。雷锋网雷锋网雷锋网