當前位置:首頁 » 操作系統 » 阿里資料庫自研

阿里資料庫自研

發布時間: 2023-09-11 06:23:39

㈠ 一場替換傳統資料庫的行動正在全球范圍悄然進行

隨著全球各大 科技 巨頭的競相加入,開源軟體技術已經活躍在各個信息技術領域當中。其中,大數據生態成為開源技術的直接受益者。開源技術適用於龐雜的數據管理系統,帶來敏捷、高效、可擴展以及可自控的管理能力,並幫助企業降低IT建設及維護成本。2018年雙11當天,阿里雲原生資料庫PolarDB輕松應對了0點0分0秒瞬時提升122倍的數據洪峰。Netflix也採用自研開源架構Metacat將海量數據集合成一個「單一」的數據倉庫,大幅提升管理能效。

當前,我國有越來越多的企業、人才加入到開源社區,貢獻力也「後來居上」,共同推進開源項目、開源生態的繁榮和可持續發展。

大數據生態成為開源技術重大「受益者」

近年來,在互聯網服務、多媒體以及科學研究等多個領域,都可見到大數據的身影。在大數據時代,不斷增長的數據量、快速處理數據的需求以及數據類型、結構和來源的多樣性給資料庫敏捷、高效、可擴展性以及個性化管理帶來了全新挑戰。

開源技術賦能了大數據生態的高質量發展。賽迪智庫信息化和軟體服務業所博士蒲松濤表示,經過了數十年的發展,開源軟體和開源工具已經應用到了大數據產業發展的各個環節,基於開源軟體,企業可以快速構建大數據應用平台,提供豐富的大數據開發和應用工具。

當前,幾乎各種規模的企業都在使用開源軟體和工具做大數據處理和基於數據的預測分析。開源界也涌現出了Hadoop、OpenStack、OpenShift、Maprece、docker等引領行業技術創新方向的重量級開源項目。

華泰人壽基於OpenShift架構打造易於管理的新IT系統,以提升企業競爭力,實現業務數字化轉型。在基礎設施上,引入紅帽OpenShift容器雲解決方案和紅帽Ceph分布式存儲。通過將保險業務上docker雲,實現華泰人壽業務的彈性伸縮和快速上線,加速其互聯網保險項目快速落地。

美國知名在線影片租賃提供商Netflix也採用了大數據發現服務的開源框架Metacat。由於Netflix的數據倉庫由許多大型的數據集組成,為了確保數據平台能夠橫跨這些數據集成為一個「單一」的數據倉庫,Netflix開發的元數據服務Metacat,能讓數據的發生、發現、處理和管理變得更加快捷高效、處理精度大幅提升;同時還可兼容Spark、Presto、Pig和Hive架構。Netflix軟體架構師Ajoy Majumdar指出,開放開源是身為技術公司的競爭戰略,既能夠將自己的解決方案建立為行業標准和最佳實踐,又能建立Netflix的技術品牌,還能從共享生態中獲得反饋輸入並受益。

事實上,推動大數據應用高質量發展的主流開源平台還有很多,例如Spark、Shark、Bagel等。蒲松濤表示,這些開源平台大幅降低應用門檻,有效幫助企業實現工業級應用,進而帶動各行業大規模部署。此外,大數據還涌現出了一批開源支線平台。其中,Storm完全擺脫了經典的MapRece架構,重新設計了一個適用於流式計算的架構,以數據流為驅動觸發計算,計算時效性高,適應有向無環圖計算拓撲的設計,計算方式較為靈活,在業界得到了一定的部署應用。

開源社區供需「雙贏」中國力量已崛起

開源社區的建立為推動開源軟體發展、構建行業競爭優勢做出突出貢獻,隊伍的壯大需要每一位使用者持續不斷的貢獻智慧,以實現真正的「共贏」。開源的發展歷程中,極客、大公司、商業顛覆者輪番登場,開源技術的訴求也從商業驅動向生態驅動發展。中國工程院院士廖湘科指出,開源是軟體創新技術的主要來源,是生態抓手,而非贏利的切入點。

開源軟體的「共享和貢獻」機制吸引了眾多開發者的參與,給了每一位開發者「顛覆 游戲 規則」的權利。有了這種生態的加持,信息技術將被快速推進,各個參與者將持續獲利。對此,李飛飛表示,開源生態的受益者是開源技術的需求側和供給側雙方。從供給側角度來看,參與的人越多,思維碰撞而引發的迭代演進就會越快;從需求側角度來看,各個企業不僅可以免除被閉源系統「技術綁定」,還可以在開源社區實現資料庫技術遷移,企業還可針對企業技術特徵進行資料庫的個性定製化,實現大量的應用和代碼的改造且系統間互相兼容。

中國開源軟體推進聯盟副 主席 兼秘書長劉澎在Postgresql .CN 2019上表示,當前國內越來越多的企業為開源做出重要貢獻,我國的開源實力已經崛起。以華為、阿里等為代表的開源軟體開發者已經逐漸與亞馬遜、微軟站到了同一高度,實現了從「使用者」到「引領者」的身份轉變。

目前,中國企業在Linux基金會中有1個白金會員(華為),1個金牌會員(阿里雲)和數十家銀牌會員(包括騰訊、中國移動、聯想等)。華為在多個開源社區貢獻排名前列。中國工程院院士倪光南認為,華為是開源軟體的優秀開發代表,通過引進、消化,實現創新發展,進而貢獻給整個開源社區。

阿里雲也成為 游戲 規則的重要改變者和全球雲資料庫領跑者之一。2018年,阿里雲資料庫成功進入Gartner資料庫魔力象限,這是該榜單首次出現中國公司。近日,Gartner發布的全球雲資料庫市場份額榜單中,阿里雲位居第三,超越了Oracle、IBM和谷歌。5月21日,阿里雲提供傳統資料庫一鍵遷移上雲能力,可以幫助企業將線下的MySQL、PostgreSQL和Oracle等資料庫輕松上雲,最快數小時內遷移完成。李飛飛表示,阿里雲自研的PolarDB雲原生資料庫的分布式存儲架構具有一寫多度、計算與存儲分離等優勢,幫助淘寶交易平台應對了雙11當天瞬時提升122倍的數據洪峰。

此外,國內還有包括網路、浪潮、瀚高等在內的眾多企業積極參與並貢獻到開源社區當中。人工智慧、自動駕駛等新興信息技術也成為開源項目的重要應用領域。

㈡ 如何看待 openGauss 堅持開源開放,打造面向數字基礎設施的開源資料庫的行為

在國產資料庫技術發展的初級探索階段,技術是關鍵,而在當下的快速發展階段,生態就成為最重要的一環。
開源是形成初步版本、擴大開發者和用戶群體、增強技術影響里的重要一環。開源是對生態的動態推進。
openGauss(2020年6月30日開源)在2019年9 月 19 日,在華為 CONNECT 大會上,華為宣布將開源其 GaussDB 資料庫,開源後的產品被命名為 openGauss,這也是openGauss的「open」開頭的由來。
2020年10月12日發布第一個正式公開版本——openGauss 1.0.1版本,2021年10月發布openGauss 2.1.0版本。一款開源關系型資料庫管理系統,採用客戶端/伺服器,單進程多線程架構,支持單機和一主多備部署方式,備機可讀,支持雙機高可用和讀擴展。採用木蘭寬松許可證v2發行。2022年4月1號,3.0版本正式發布。openGauss內核源自PostgreSQL,深度融合華為在資料庫領域多年的經驗,結合企業級場景需求,持續構建競爭力特性。
另外:OceanBase(2021年6月1號開源)阿里和螞蟻集團開源的資料庫,是完全自研的分布式關系資料庫
TiDB(2015年4月開源)PingCAP 公司自主設計、研發的開源分布式關系型資料庫,一款同時支持在線事務處理與在線分析處理的融合型分布式資料庫產品。

㈢ 阿里平頭哥宣布,自研處理器已成功落地,它的性能如何

阿里巴巴宣布旗下的平頭哥半導體完成了安卓10對RISC-V的移植並開源了全部相關代碼。從平頭哥社區發布的信息來看,安卓10系統已經可以在玄鐵910晶元上流暢運行。

至於玄鐵910,則是前年阿里巴巴旗下的平頭哥半導體發布的一款號稱是業界最強的RISC-V處理器內核IP。資料顯示,玄鐵910單核性能達到7.1 Coremark/MHz,主頻達到2.5GHz,比當時業界最好的RISC-V處理器性能高40%以上。據介紹,玄鐵910可以用於設計製造高性能端上晶元,應用於5G、人工智慧以及自動駕駛等領域。

㈣ 阿里雲rds資料庫是自主研發的嗎

一般rds習慣性指mysql資料庫實例,但其實也包含sqlserver。這兩種資料庫一個是開源的,一個是微軟的,都不算是阿里研發的資料庫。
華為雲 rds-gaussdb系列都是自主研發的。

㈤ 阿里巴巴採用自己研發的分布式資料庫系統叫什麼,它有哪些特點

上層的是分布式資料庫分表分庫中間件,負責和上層應用打交道,對應用可表現為一個獨立的資料庫,而屏蔽底層復雜的系統細節。分布式資料庫中間件除了基本的分表分庫功能,還可以豐富一下,比如講讀寫分離或者水平擴容功能集成在一起,或者比如讀寫分離本身也可以作為一個獨立的中間件。(Cobar, MyCAT, TDDL, DRDS, DDB)

增量數據訂閱和消費,用戶對資料庫操作,比如DML, DCL, DDL等,這些操作會產生增量數據,下層應用可以通過監測這些增量數據進行相應的處理。典型代表Canal,根據MySQL的binlog實現。也有針對Oracle(redolog)的增量數據訂閱與消費的中間件。(Canal, Erosa)

資料庫同步中間件涉及資料庫之間的同步操作,可以實現跨(同)機房同步以及異地容災備份、分流等功能。可以涉及多種資料庫,處理之後的數據也可以以多種形式存儲。(Otter, JingoBus, DRC)

資料庫與資料庫之間會有數據遷移(同步)的動作,同款數據同步原理比較簡單,比如MySQL主備同步,只要在資料庫層進行相應的配置既可,但是跨資料庫同步就比較復雜了,比如Oracle->MySQL. 數據遷移一般包括三個步驟:全量復制,將原資料庫的數據全量遷移到新資料庫,在這遷移的過程中也會有新的數據產生;增量同步,對新產生的數據進行同步,並持續一段時間以保證數據同步;原庫停寫,切換新庫。將「跨資料庫」這個含義擴大一下——「跨數據源」,比如HDFS, HBase, FTP等都可以相互同步。(yugong, DataX)

㈥ OceanBase那麼厲害,為什麼不去和Oracle競爭,搶占企業市場的市場份額

因為干不過 吹出來的 給不懂的人看而已 1500多個節點的分布式架構和人家10年前27節點rac比!別忘了你用的ssd 人家還是機械盤!

阿里巴巴旗下的資料庫OceanBase屢屢在國際上獲得資料庫競賽大獎,不少人就要問了,既然OceanBase這么厲害,為什麼阿里巴巴不去搶佔Oracle的市場份額呢?

OceanBase競賽結果有片面性、功能還不夠完善

事實上在阿里系內部,也只有螞蟻金服是真正在大規模使用,在阿里系內部其他團隊已經有三大資料庫,X-DB是阿里集團資料庫團隊搞的,PolarDB是阿里雲團隊、也就是李飛飛博士負責的,OceanBase是螞蟻金服資料庫團隊搞的,現在阿里內部已經推進了X-DB和PolarDB的全面融合,李飛飛博士領導的PolarDB團隊將會立足長遠,是下一代資料庫系統,未來阿里雲的業務有多廣,PolarDB要面對的業務場景就有多復雜。

OceanBase最大的優勢在於這是阿里真正完全自研的資料庫,跟阿里雲一樣,是從頭到尾完全自研的,當然這個完全自研到底到底有沒有水分我們並不知道。大家了解OceanBase就是之前的打比賽,不過OceanBase佔了分布式的光,吃了硬體的便宜,加上最近十年Oracle已經不來打比賽了,阿里本質上是跟十年前的Oracle在比,軟硬體技術都不在同一個起點上,這也是這個競賽結果有很大片面性的根本原因。在單機性能方面,Oracle依然要更強一些,穩定性就更不用說了,Oracle已經穩定運行了這么多年。


OceanBase之所以還沒辦法跟Oracle競爭,是因為OceanBase還沒有那麼強,也還有非常多需要完善的地方,功能上還有很多不足,在阿里內部資料庫分化也還比較明顯,OceanBase在跟另外的產品競爭當也,沒有優勢。

OceanBase「專屬性」明顯、開源後閉源,企業要穩定、企業也不都是阿里

OceanBase更多的還是圍繞螞蟻金服自己的業務在做,現在除了阿里系內部在使用,真正的商業化用戶也就只有PICC、南京銀行兩個比較大,是在真正使用OceanBase,客戶群體還太小太小,樣本數量確實還不夠大。

OceanBase之前其實是開源了的,不過後來又閉源了,在商業化過程中也遇到了一些問題,這個操作當時其實就嚇到了很多人,OceanBase閉源之後的版本跟原來的差距非常大的。OceanBase更適合處理互聯網業務,跟傳統企業業務契合度並沒有那麼高,Oracle的很多功能OceanBase都還不具備,OceanBase的生態、工具、技術支持還差很多很多。oceanbase是為大規模事務處理准備的分布式系統,聽起來很強大,但是真的不夠接地氣。


OceanBase針對阿里的業務進行了深度優化和定製,這就讓OceanBase在通用性上有了很大的阻礙。可是在其他企業就很難的,阿里有很好的技術團隊,他們也可以為了業務做出專門的調整,阿里有這樣的能力和資源,但是小企業沒有這樣的配置,尤其是傳統企業根本不可能做這樣的事情。大家更希望系統是穩定好用的,拿過來就可以直接用的,你現在又不開源了,用戶擔心更大,還不如繼續用穩定的Oracle資料庫。

技術這東西吧我還是喜歡說句實話,不是你自己說你有多厲害就真的多厲害,還得是實際場景的應用才行。就像網路一樣,好像這些年大家也不吹網路了,但是春晚一戰,網路成為唯一一個扛住了春晚流量洪峰的企業,技術實力業內人都看得明白。OceanBase做得很好,但是也沒有那麼好,至少是目前應用還沒有那麼好。

早就在競爭了!

實際上阿里雲的OceanBase資料庫系統在推出以後,實際上就已經開始商業化運作了,就在不斷的從甲骨文公司手裡面搶到更多的企業級應用市場了。

OceanBase確實很先進

近日,在資料庫領域內,OceanBase資料庫又打破了世界記錄,直接創造了7.07億TPMC的新世界記錄。

從OceanBase的功能和速度來看,現在OceanBase是世界領先的資料庫產品,在被譽為「資料庫領域世界盃」的國際權威TPC-C測試中,OceanBase性能分數打破Oracle多年壟斷,不斷創造新的世界記錄。

而且OceanBase採用新一代分布式處理技術,顛覆了傳統資料庫集中式技術架構,尤其適應了互聯網持續擴張的數據處理需求。

正是OceanBase資料庫的可擴容的特點,也降低了用戶的使用成本,而且又擁有很高的速度,因此,現在OceanBase在企業市場中的份額是越來越大了。

現在阿里雲市場份額很大

阿里雲市場份額不斷擴大。根據國際研究機構Gartner發布最新雲計算市場追蹤數據,阿里雲亞太市場排名第一,全球市場排名第三。在全球市場份額中,阿里雲僅次於美國的亞馬遜和微軟公司。

阿里雲從2018年到2019年,在全球市場份額從7.7%上漲至9.1%,進一步拉開與第四名谷歌差距,擠佔了不少亞馬遜的份額。而在亞太市場,阿里雲的份額更大,從2018年的26%上漲至2019年的28%,接近亞馬遜和微軟公司的總和。

現在阿里雲的服務其中一項最重要的就是資料庫的服務,也就是OceanBase資料庫的服務。

實際上,從2015年,OceanBase資料庫推出以後,淘寶和支付寶系統就開始了去IOE,開始上雲,然後好多銀行的金融服務也開始去IOE,上雲。這些實際上都是開始拋棄甲骨文資料庫系統了。到現在為止,通過上雲使用OceanBase資料庫資料庫的企業和公司就更多了。

結論

綜上所述,OceanBase資料庫早就在跟甲骨文公司進行競爭了,現在阿里雲的份額在全球排在第三名,阿里雲其中最關鍵的應用就是OceanBase資料庫的應用了。

OceanBase其對標的是亞馬遜的Aurora,你要目前去和Oracle競爭,這個目前還不對等。



OceanBase滿打滿算10年的時間,Oracle呢,40多年了。目前大的企業,像銀行、電信這些核心企業,基本上是Oracle的天下,也有Sybase、DB2、SQLServer。其實還是那幾個巨頭在玩,甲骨文、微軟、IBM、SAP,這些可都是企業服務領域的巨頭。


聽到DB2(IBM)是不是有人覺得老土了,但是現實就是還有很多系統在用,為什麼呢?因為有些系統要切換資料庫,估計要出大問題。


互聯網公司反而在這方面投入不高,那就用像MySQL這種開源的,最先MySQL被SUN公司收購了,現在SUN又被Oracle收購了,所以還是Oracle旗下的。



Oracle之所以這么強勢,就是因為其產品的穩定性,尤其是金融類機構,一點數據問題都不能出,否則你銀行里只有100塊,花出去了101塊,這個問題就大了。你可以想下,幾十年,遍布全球的金融類機構,大部分只敢用Oracle,就是因為產品穩定。而且這么長時間的技術積累,問題解決經驗,這個真的不是說自研就解決的。


伴隨著雲服務的大趨勢,幾個主要的雲服務提供商,亞馬遜、阿里、騰訊都在發力資料庫,像淘寶、微信這種大的國內應用,本身必然會要求其資料庫團隊越來越強大。


OceanBase其實也在慢慢的搬運Oracle的客戶,但是這個急不得。其實在市場定位上,國內的大量互聯網公司並沒有使用Oracle,因為太貴了。所以這部分客戶才是OceanBase的主要目標。



Oracle代表的是雲服務以前的頂峰,而且目前看想替換不是幾年的事情。新的OceanBase伴隨著雲服務的擴展,必然一步步的能取得更多的市場份額。阿里雲發展必然能帶動OceanBase的快速發展。


慢慢來吧,數據要的是穩定。

第一,oceanbase是否比Oracle強並不能完全肯定,Oracle這么多年的發展形成了完整的生態,讓大多數人熟悉了他那一套,oceanbase應該說在一些場景下比Oracle強,尤其分布式方面,因為他這方面在自身業務驅動下更加突出。

第二,Oracle的客戶基本上是規模型企業,且一般用於核心業務系統上,切換成本很大,風險很大,做這樣的決策是非常困難的。

第三,人才培養沒有那麼快,切換oceanbase沒有多少人會,培訓學習和運營管理都需要時間

第四,阿里發展重心不是這種產品銷售模式,Oracle這種模式需要大量的營銷團隊和服務支持團隊

第五,阿里時機還未到,先通過雲服務不斷發展客戶完善產品,後期根據自身的發展策略可能會決定面向客戶銷售

銀行 金融 政府等行業是不會去嘗試新技術的 他們要的是穩定 可靠 打個比方 銀行每天流水 1個億 用新系統 花錢了 而且出了問題 損失了 誰負責?!花錢不討好!銀行也不差那點軟體版權費!

應用場景差別很大,分布式系統維護成本很高。這和外國寧願買二手F16,也不願意采購殲10一樣,更何況,OB確實還不如Oracle。

但是現階段貿易戰,已經消除了Oracle的空間,正是OB等系統的機會

如你所願。

oceanbase最近獨立運營了,開始發力推廣。先把TPC-C基準測試排名達到世界第一。(第二也是自己,這次是二刷)

然後最近剛剛開源。把300萬核心代碼都開源出來。大家可到github上查看。

金融領域繼續發力。和合作夥伴一起做去O。盡量能兼容Oracle,讓客戶無損切換到oceanbase上來。

相信不遠的將來,中國企業都能用上國產高性能資料庫。

㈦ 對話阿里雲李飛飛:關於雲原生資料庫的五大預判

作者:王慧賢

數據存儲、數據分析、數據安全......如今,圍繞「數據」的話題越來越多,離人們的生活也越來越近。

從陌生到熟悉,數據不僅「出圈」,甚至已然站在了C位。去年,中央發布的《關於構建更加完善的要素市場化配置體制機制的意見》中明確表示,繼土地、勞動力、資本、技術後,數據成為第五大生產要素。

步入信息化時代後,資料庫、操作系統與中間件作為計算機最基礎的三大軟體,支撐著企業的正常運行。

當數據成為生產要素後,必然會迎來爆發式增長,企業的數據存儲和處理需求將進一步釋放。更重要的是,疫情加快了數字化轉型的腳步,更加速了企業的上雲速度。

從信息化到數字化,時代的變革,總會帶來商業世界的變化。如何在雲原生架構下使用資料庫,成為企業的痛點和雲廠商的機會,亞馬遜AWS的CTO Werner Vogels曾多次強調:「資料庫是雲計算的終極之戰。」

在數智化時代,雲原生到底意味著什麼?雲原生資料庫和傳統資料庫相比,核心優勢是什麼?是否把資料庫搬上雲就是雲原生?基於這些問題,雷鋒網與阿里巴巴集團副總裁、阿里雲資料庫產品事業部負責人李飛飛展開一場對話。

國產雲原生資料庫,擺脫「切膚之痛」

如今,資料庫的商業世界,因為雲的出現與發展,分成了兩大派系。

一派是以Oracle為代表的傳統商用資料庫,一派是以國外AWS、國內阿里雲為代表的雲原生資料庫,去「IOE革命」下的產物。

其實,早期較為火熱的資料庫種類有三種,層次式資料庫、網路式資料庫和關系型資料庫。

在《浪潮之巔》一書中,作者吳軍寫下了這樣的觀點:「Oracle 的興起很大程度上靠的是它最早看到關系型資料庫的市場前景,並且在商業模式上優於 IBM。」

因此,在雲原生資料庫「入世」之前,資料庫的天下一直是Oracle的,國內大部分互聯網公司都不得不採用Oracle+IBM小型機+EMC的模式來維持正常運營。

高昂的費用,使得對於資料庫需求較大的互聯網巨頭「忍無可忍」。

2009年,阿里巴巴的Oracle RAC 集群節點數達到了創記錄的20個。可由於Oracle並沒有彈性擴展的功能,只能按照峰值流量購買小型機和資料庫,導致阿里將業務上漲帶來的大部分利潤,都支付給了Oracle。

第二年,阿里便開始走上了去「IOE」之路,根據開源MySQL搭建了AliSQL,並順利經過了淘寶雙11的考驗,國產雲原生資料庫算是正式擺脫了「切膚之痛」,逐漸受到市場的真正認可。

另一邊,國外的AWS在2015年公布了基於雲計算的自研資料庫Amazon Aurora。Aurora是一個關系型資料庫,可以跨3個可用區域復制6份數據,其最大的特性就是高性能和高可用性。

雲計算巨頭的入局,讓雲原生資料庫在國內外一步步成為主流。據Gartner預測,到了2021年,雲資料庫在整個資料庫市場中的佔比將首次達到50%,到2023年,75%的資料庫都要跑在雲平台之上。

關於雲原生資料庫,隨著逐步的出圈,也讓人們關心的焦點從「是啥?」轉變為「還能解決哪些問題?」

但雲原生資料庫存在著數據孤島的問題,無法打通多個數據系統的情況下,企業在數據加工和數據管理上就會「壓力較大」,甚至在數據安全方面還存在隱患。

傳統數據倉庫一般基於T+1數據集成構建離線數倉,以支撐企業各項分析與服務。傳統方案不但會影響線上業務穩定性,且難以支持企業的實時需求。

因此,在李飛飛看來,雲原生資料庫已經走到2.0階段。這個階段要解決的問題,就是上述存在的痛點。

9月26日,在阿里雲資料庫創新上雲峰會上,阿里雲發布了首個一站式敏捷數據倉庫解決方案。該方案結合一站式數據管理平台DMS及雲原生數據倉庫AnalyticDB(簡稱:ADB),實現了庫倉一體的技術架構,提供在線數據實時入倉、T+1周期性快照、按需建倉等能力,數據延時低至秒級,持續賦能業務在線化,使企業的在線數據可以釋放出更大的價值。

相較於傳統方案,阿里雲一站式敏捷數據倉庫解決方案有4大核心優勢:

1、對業務側影響小,不會因為數據匯聚集中和實時加工影響業務側正常運行,CPU、內存佔用低於5%;

2、事務順序和數據准確性有保障,且處理鏈路短,支持在線數據實時處理落倉,效率更高。數據傳輸效率100m/s,數據延時在10秒內;

3、支持復雜實時數據加工、計算邏輯;

4、低代碼操作,能夠大大降低實時數倉的構建難度,提升構建效率的同時,支撐企業數字化轉型過程中的各類實時場景。

除了實時統計分析場景外,企業為滿足周期性數據分析需求,需建設周期性全量快照。

傳統數倉的周期性全量集成方案會對生產業務造成穩定性影響、全量集成時效性差、且無法滿足客戶針對任意時間點進行數據回溯的業務訴求。

針對T+1周期性集成場景,一站式敏捷數據倉庫解決方案支持基於拉鏈表的T+1全量數據快照,用戶通過簡單幾個步驟,即可按需生成各種周期的全量或增量快照。

此外,業務還可按需進行任意時間點的數據回溯,以快速解決數據異常問題。

談起未來資料庫的發展趨勢,李飛飛提到以下五點:

1、雲原生+分布式一定是資料庫的標配,分布式已經是必選項。分布式資料庫由多個相互連接的資料庫組合而成,面向用戶則是以單個資料庫的形態出現。雲原生分布式資料庫具備易用性、高擴展性、快速迭代、節約成本等特徵,從資源池化到彈性擴展,再到智能運維,再到離在線一體化,解決企業用戶的核心訴求。

2、AI for DB(database,指資料庫)和 DB for AI 將是主流趨勢。用AI將資料庫運維管控智能化,尤其在雲原生+分布式這個前提下更重要,因為資料庫不僅是內核的能力彈性高可用、可拓展性,更重要的是部署後應用和運維的復雜度要大大降低。在資料庫里,面對越來越多非結構化的數據,分析能力十分重要。

3、數據的安全可信,在今天這個大環境下變得愈發重要,如何確保整個資料庫系統,在處理數據全鏈路過程中提供加密能力、多方安全計算能力、隱私保護的能力,也是很重要的趨勢。

4、多模數據處理能力將越來越重要。比如,新型資料庫多模態的處理能力,在新能源 汽車 企業打標簽、智能電池化預測等應用場景中,將發揮越來越重要的作用。

5、一份數據,多個數據處理引擎:實現倉庫一體、倉庫聯動、倉庫打通,數據之間無縫流轉。

以上判斷,也從側面反映出阿里雲資料庫的走向,這點毋庸置疑。但除此之外,業界最關心的,還有開源。

近半年,國內很多廠商相繼提出開源戰略,背後緣由顯而易見,為了打造生態。就在今年的阿里雲峰會上,阿里雲智能總裁、達摩院院長張建鋒(花名行癲)將2021年阿里雲的發展關鍵詞歸納為:做好服務、做深基礎、做厚中台、做強生態。

做好服務與生態,成為如今廠商們不約而同的目標,而開源,就是最好的選擇。

當雷鋒網問到:「未來,阿里雲資料庫會不會把所有能力都開源?」這一問題時,李飛飛給到的回答是:「不會。」

之所以有這樣的回答,是因為對於開源,他有著一些判斷和看法。

李飛飛表示,這些部分,本就是阿里雲資料庫的商業化版本。

事實上,業界大多數的資料庫廠商都不會針對自身的核心能力開源,如TiDB的核心管控組件、TiFlash。

與像MongoDB,、Cassandra、CouchDB這些以開源起家的資料庫廠商不同,開源只是阿里雲資料庫的戰略,不是阿里雲資料庫的命脈。

前幾年,有業內人士表示,在面向開源時,國產資料庫首先需要解決信任以及開源知識產權等問題。「開源會讓廠商更加認真思考版權還有專利的問題,事實上,選擇開源後,對於資料庫廠商提出了更高的要求。」

李飛飛認為,開源只是一種選擇,資料庫開源成功並不代表著商業化就能夠成功,不開源也不能代表廠商不先進。

更准確的說,開源只是一種有效手段。

最終,阿里雲資料庫希望客戶能夠通過開源版本把阿里雲資料庫產品技術快速用起來,並能夠參與到技術產品的迭代過程中,在一些高階能力上,借鑒團隊專業能力和阿里雲的服務能力,成為良好的商業合作夥伴,這是李飛飛以及阿里雲資料庫對於開源的一些基本思考。雷鋒網雷鋒網雷鋒網

熱點內容
安卓手機連拍圖片怎麼保存 發布:2025-01-28 00:48:12 瀏覽:645
怎麼看出車輛配置是不是舊車 發布:2025-01-28 00:42:42 瀏覽:3
編譯時的程序在哪裡 發布:2025-01-28 00:42:39 瀏覽:345
ftp協議的功能 發布:2025-01-28 00:38:53 瀏覽:251
linux統計ip 發布:2025-01-28 00:38:50 瀏覽:153
游戲解壓泥 發布:2025-01-28 00:38:04 瀏覽:728
curlandroid下載 發布:2025-01-28 00:20:10 瀏覽:873
數控車編程視頻 發布:2025-01-28 00:15:02 瀏覽:967
壓縮機帶電 發布:2025-01-28 00:06:14 瀏覽:195
雲存儲拓撲圖 發布:2025-01-27 23:58:00 瀏覽:830