数据库一体机平台
支持iSCSI、FC、NFS、CIFS、HTTP、FTP等多种存储前差派协议。华为数据库一体机是基于内存庆瞎运算的数据库一体机,在华为创新的软硬件平台中支持iSCSI、FC、NFS、CIFS、慧贺HTTP、FTP等多种存储协议,搭载业界领先的SAP HANA内存数据库软件,为企业ERP、数据仓库等关键应用加速,助力企业迅速分析和获取关键数据。
‘贰’ 2019数据架构选型必读:1月数据库产品技术解析
本期目录
DB-Engines数据库排行榜
新闻快讯
一、RDBMS家族
二、Nosql家族
三、NewSQL家族
四、时间序列
五、大数据生态圈
六、国产数据库概览
七、云数据库
八、推出dbaplus Newsletter的想法
九、感谢名单
为方便阅读、重点呈现,本期Newsletter(2019年1月)将对各个板块的内容进行精简。需要阅读全文的同学可点击文末 【阅读原文】 或登录https://pan..com/s/13BgipbaHeMfvm0YPtiYviA
DB-Engines数据库排行榜
以下取自2019年1月的数据,具体信息可以参考http://db-engines.com/en/ranking/,数据仅供参考。
DB-Engines排名的数据依据5个不同的因素:
新闻快讯
1、2018年9月24日,微软公布了SQL Server2019预览版,SQL Server 2019将结合Spark创建统一数据平台。
2、2018年10月5日,ElasticSearch在美国纽约证券交易所上市。
3、亚马逊放弃甲骨文数据库软件,导致最大仓库之一在黄金时段宕机。受此消息影响,亚马逊盘前股价小幅跳水,跌超2%。
4、2018年10月31日,Percona发布了Percona Server 8.0 RC版本,发布对MongoDB 4.0的支持,发布对XtraBackup测试第二个版本。
5、2018年10月31日,Gartner陆续发布了2018年的数据库系列报告,包括《数据库魔力象限》、《数据库核心能力》以及《数据库推荐报告》。
今年的总上榜数据库产品达到了5家,分别来自:阿里云,华为,巨杉数据库,腾讯云,星环 科技 。其中阿里云和巨杉数据库已经连续两年入选。
6、2018年11月初,Neo4j宣布完成E轮8000万美元融资。11月15日,Neo4j宣布企业版彻底闭源:
7、2019年1月8日,阿里巴巴以1.033亿美元(9000万欧元)的价格收购了Apache Flink商业公司DataArtisans。
8、2019年1月11日早间消息,亚马逊宣布推出云数据库软件,亚马逊和MongoDB将会直接竞争。
RDBMS家族
Oracle 发布18.3版本
2018年7月,Oracle Database 18.3通用版开始提供下载。我们可以将Oracle Database 18c视为采用之前发布模式的Oracle Database 12c第2版的第一个补丁集。未来,客户将不再需要等待多年才能用上最新版Oracle数据库,而是每年都可以期待新数据库特性和增强。Database 19c将于2019年Q1率先在Oracle cloud上发布云版本。
Oracle Database 18c及19c部分关键功能:
1、性能
2、多租户,大量功能增强及改进,大幅节省成本和提高敏捷性
3、高可用
4、数据仓库和大数据
MySQL发布8.0.13版本
1、账户管理
经过配置,修改密码时,必须带上原密码。在之前的版本,用户登录之后,就可以修改自己的密码。这种方式存在一定安全风险。比如用户登录上数据库后,中途离开一段时间,那么非法用户可能会修改密码。由参数password_require_current控制。
2、配置
Innodb表必须有主键。在用户没有指定主键时,系统会生成一个默认的主键。但是在主从复制的场景下,默认的主键,会对丛库应用速度带来致命的影响。如果设置sql_require_primary_key,那么数据库会强制用户在创建表、修改表时,加上主键。
3、字段默认值
BLOB、TEXT、GEOMETRY和JSON字段可以指定默认值了。
4、优化器
1)Skip Scan
非前缀索引也可以用了。
之前的版本,任何没有带上f1字段的查询,都没法使用索引。在新的版本中,它可以忽略前面的字段,让这个查询使用到索引。其实现原理就是把(f1 = 1 AND f2 > 40) 和(f1 = 2 AND f2 > 40)的查询结果合并。
2)函数索引
之前版本只能基于某个列或者多个列加索引,但是不允许在上面做计算,如今这个限制消除了。
5、SQL语法
GROUP BY ASC和GROUP BY DESC语法已经被废弃,要想达到类似的效果,请使用GROUP BY ORDER BY ASC和GROUP BY ORDER BY DESC。
6、功能变化
1)设置用户变量,请使用SET语句
如下类型语句将要被废弃SELECT @var, @var:=@var+1。
2)新增innodb_fsync_threshold
该变量是控制文件刷新到磁盘的速率,防止磁盘在短时间内饱和。
3)新增会话级临时表空间
在以往的版本中,当执行SQL时,产生的临时表都在全局表空间ibtmp1中,及时执行结束,临时表被释放,空间不会被回收。新版本中,会为session从临时表空间池中分配一个临时表空间,当连接断开时,临时表空间的磁盘空间被回收。
4)在线切换Group Replication的状态
5)新增了group_replication_member_expel_timeout
之前,如果某个节点被怀疑有问题,在5秒检测期结束之后,那么就直接被驱逐出这个集群。即使该节点恢复正常时,也不会再被加入集群。那么,瞬时的故障,会把某些节点驱逐出集群。
group_replication_member_expel_timeout让管理员能更好的依据自身的场景,做出最合适的配置(建议配置时间小于一个小时)。
MariaDB 10.3版本功能展示
1、MariaDB 10.3支持update多表ORDER BY and LIMIT
1)update连表更新,limit语句
update t1 join t2 on t1.id=t2.id set t1.name='hechunyang' limit 3;
MySQL 8.0直接报错
MariaDB 10.3更新成功
2)update连表更新,ORDER BY and LIMIT语句
update t1 join t2 on t1.id=t2.id set t1.name='HEchunyang' order by t1.id DESC limit 3;
MySQL 8.0直接报错
MariaDB 10.3更新成功
参考:
https://jira.mariadb.org/browse/MDEV-13911
2、MariaDB10.3增补AliSQL补丁——安全执行Online DDL
Online DDL从名字上看很容易误导新手,以为不论什么情况,修改表结构都不会锁表,理想很丰满,现实很骨感,注意这个坑!
有以下两种情况执行DDL操作会锁表的,Waiting for table metadata lock(元数据表锁):
针对第二种情况,MariaDB10.3增补AliSQL补丁-DDL FAST FAIL,让其DDL操作快速失败。
例:
如果线上有某个慢SQL对该表进行操作,可以使用WAIT n(以秒为单位设置等待)或NOWAIT在语句中显式设置锁等待超时,在这种情况下,如果无法获取锁,语句将立即失败。 WAIT 0相当于NOWAIT。
参考:
https://jira.mariadb.org/browse/MDEV-11388
3、MariaDB Window Functions窗口函数分组取TOP N记录
窗口函数在MariaDB10.2版本里实现,其简化了复杂SQL的撰写,提高了可读性。
参考:
https://mariadb.com/kb/en/library/window-functions-overview/
Percona Server发布8.0 GA版本
2018年12月21日,Percona发布了Percona Server 8.0 GA版本。
在支持MySQL8.0社区的基础版上,Percona Server for MySQL 8.0版本中带来了许多新功能:
1、安全性和合规性
2、性能和可扩展性
3、可观察性和可用性
Percona Server for MySQL 8.0中将要被废用功能:
Percona Server for MySQL 8.0中删除的功能:
RocksDB发布V5.17.2版本
2018年10月24日,RocksDB发布V5.17.2版本。
RocksDB是Facebook在LevelDB基础上用C++写的高效内嵌式K/V存储引擎。相比LevelDB,RocksDB提供了Column-Family,TTL,Transaction,Merge等方面的支持。目前MyRocks,TiKV等底层的存储都是基于RocksDB来构建。
PostgreSQL发布11版本
2018年10月18日,PostgreSQL 11发布。
1、PostgreSQL 11的重大增强
2、PostgreSQL 插件动态
1)分布式插件citus发布 8.1
citus是PostgreSQL的一款sharding插件,目前国内苏宁、铁总、探探有较大量使用案例。
https://github.com/citusdata/citus
2)地理信息插件postgis发布2.5.1
PostGIS是专业的时空数据库插件,在测绘、航天、气象、地震、国土资源、地图等时空专业领域应用广泛。同时在互联网行业也得到了对GIS有性能、功能深度要求的客户青睐,比如共享出行、外卖等客户。
http://postgis.net/
3)时序插件timescale发布1.1.1
timescale是PostgreSQL的一款时序数据库插件,在IoT行业中有非常好的应用。github star数目前有5000多,是一个非常火爆的插件。
https://github.com/timescale/timescaledb
4)流计算插件 pipelinedb 正式插件化
Pipelinedb是PostgreSQL的一款流计算插件,使用这个创建可以对高速写入的数据进行实时根据定义的聚合规则进行聚合(支持概率计算),实时根据定义的规则触发事件(支持事件处理函数的自定义)。可用于IoT,监控,FEED实时计算等场景。
https://github.com/pipelinedb/pipelinedb
3、PostgreSQL衍生开源产品动态
1)agensgraph发布 2.0.0版本
agensgraph是兼容PostgreSQL、opencypher的专业图数据库,适合图式关系的管理。
https://github.com/bitnine-oss/agensgraph
2)gpdb发布5.15
gpdb是兼容PostgreSQL的mpp数据库,适合OLAP场景。近两年,gpdb一直在追赶PostgreSQL的社区版本,预计很快会追上10的PostgreSQL,在TP方面的性能也会得到显着提升。
https://github.com/greenplum-db/gpdb
3)antdb发布3.2
antdb是以Postgres-XC为基础开发的一款PostgreSQL sharding数据库,亚信主导开发,开源,目前主要服务于亚信自有客户。
https://github.com/ADBSQL/AntDB
4)迁移工具MTK发布52版本
MTK是EDB提供的可以将Oracle、PostgreSQL、MySQL、MSSQL、Sybase数据库迁移到PostgreSQL, PPAS的产品,迁移速度可以达到100万行/s以上。
https://github.com/digoal/blog/blob/master/201812/20181226_01.md
DB2发布 11.1.4.4版本
DB2最新发布Mod Pack 4 and Fix Pack 4,包含以下几方面的改动及增强:
1、性能
2、高可用
3、管理视图
4、应用开发方面
5、联邦功能
6、pureScale
NoSQL家族
Redis发布5.0.3版本
MongoDB升级更新MongoDB Mobile和MongoDB Stitch
2018年11月21日,MongoDB升级更新MongoDB Mobile和MongoDB Stitch,助力开发人员提升工作效率。
MongoDB 公司日前发布了多项新产品功能,旨在更好地帮助开发人员在世界各地管理数据。通过利用存储在移动设备和后台数据库的数据之间的实时、自动的同步特性,MongoDB Mobile通用版本助力开发人员构建更快捷、反应更迅速的应用程序。此前,这只能通过在移动应用内部安装一个可供选择或限定功能的数据库来实现。
MongoDB Mobile在为客户提供随处运行的自由度方面更进了一步。用户在iOS和安卓终端设备上可拥有MongoDB所有功能,将网络边界扩展到其物联网资产范畴。应用系统还可以使用MongoDB Stitch的软件开发包访问移动客户端或后台数据,帮助开发人员通过他们希望的任意方式查询移动终端数据和物联网数据,包括本地读写、本地JSON存储、索引和聚合。通过Stitch移动同步功能(现可提供beta版),用户可以自动对保存在本地的数据以及后台数据库的数据进行同步。
本期新秀:Cassandra发布3.11.3版本
2018年8月11日,Cassandra发布正式版3.11.3。
Apache Cassandra是一款开源分布式NoSQL数据库系统,使用了基于Google BigTable的数据模型,与面向行(row)的传统关系型数据库或键值存储key-value数据库不同,Cassandra使用的是宽列存储模型(Wide Column Stores)。与BigTable和其模仿者HBase不同,数据并不存储在分布式文件系统如GFS或HDFS中,而是直接存于本地。
Cassandra的系统架构与Amazon DynamoDB类似,是基于一致性哈希的完全P2P架构,每行数据通过哈希来决定应该存在哪个或哪些节点中。集群没有master的概念,所有节点都是同样的角色,彻底避免了整个系统的单点问题导致的不稳定性,集群间的状态同步通过Gossip协议来进行P2P的通信。
3.11.3版本的一些bug fix和改进:
NewSQL家族
TiDB 发布2.1.2版本
2018 年 12 月 22 日,TiDB 发布 2.1.2 版,TiDB-Ansible 相应发布 2.1.2 版本。该版本在 2.1.1 版的基础上,对系统兼容性、稳定性做出了改进。
TiDB 是一款定位于在线事务处理/在线分析处理( HTAP: Hybrid Transactional/Analytical Processing)的融合型数据库产品。除了底层的 RocksDB 存储引擎之外,分布式SQL层、分布式KV存储引擎(TiKV)完全自主设计和研发。
TiDB 完全开源,兼容MySQL协议和语法,可以简单理解为一个可以无限水平扩展的MySQL,并且提供分布式事务、跨节点 JOIN、吞吐和存储容量水平扩展、故障自恢复、高可用等优异的特性;对业务没有任何侵入性,简化开发,利于维护和平滑迁移。
TiDB:
PD:
TiKV:
Tools:
1)TiDB-Lightning
2)TiDB-Binlog
EsgynDB发布R2.5版本
2018年12月22日,EsgynDB R2.5版本正式发布。
作为企业级产品,EsgynDB 2.5向前迈进了一大步,它拥有以下功能和改进:
CockroachDB发布2.1版本
2018年10月30日,CockroachDB正式发布2.1版本,其新增特性如下:
新增企业级特性:
新增SQL特性:
新增内核特性:
Admin UI增强:
时间序列
本期新秀:TimescaleDB发布1.0版本
10月底,TimescaleDB 1.0宣布正式推出,官方表示该版本已可用于生产环境,支持完整SQL和扩展。
TimescaleDB是基于PostgreSQL数据库开发的一款时序数据库,以插件化的形式打包提供,随着PostgreSQL的版本升级而升级,不会因为另立分支带来麻烦。
TimescaleDB架构:
数据自动按时间和空间分片(chunk)
更新亮点:
https://github.com/timescale/timescaledb/releases/tag/1.0.0
大数据生态圈
Hadoop发布2.9.2版本
2018年11月中旬,Hadoop在2.9分支上发布了新的2.9.2版本,该版本进行了204个大大小小的变更,主要变更如下:
Greenplum 发布5.15版本
Greenplum最新的5.15版本中发布了流式数据加载工具。
该版本中的Greenplum Streem Server组件已经集成了Kafka流式加载功能,并通过了Confluent官方的集成认证,其支持的主要功能如下:
国产数据库概览
K-DB发布数据库一体机版
2018年11月7日,K-DB发布了数据库一体机版。该版本更新情况如下:
OceanBase迁移服务发布1.0版本
1月4日,OceanBase 正式发布OMS迁移服务1.0版本。
以下内容包含 OceanBase 迁移服务的重要特性和功能:
SequoiaDB发布3.0.1新版本
1、架构
1)完整计算存储分离架构,兼容MySQL协议、语法
计算存储分离体系以松耦合的方式将计算与存储层分别部署,通过标准接口或插件对各个模块和组件进行无缝替换,在计算层与存储层均可实现自由的弹性伸缩。
SequoiaDB巨杉数据库“计算-存储分离”架构详细示意
用户可以根据自身业务特征选择面向交易的SQL解析器(例如MySQL或PGSQL)或面向统计分析的执行引擎(例如SparkSQL)。众所周知,使用不同的SQL优化与执行方式,数据库的访问性能可能会存在上千上万倍的差距。计算存储分离的核心思想便是在数据存储层面进行一体化存储,在计算层面则利用每种执行引擎的特点针对不同业务场景进行选择和优化,用户可以在存储层进行逻辑与物理的隔离,将面向高频交易的前端业务与面向高吞吐量的统计分析使用不同的硬件进行存储,确保在多类型数据访问时互不干扰,以真正达到生产环境可用的多租户与HTAP能力。
2、其他更新信息
1)接口变更:
2)主要特性:
云数据库
本期新秀:腾讯发布数据库CynosDB,开启公测
1、News
1)腾讯云数据库MySQL2018年重大更新:
2)腾讯云数据库MongoDB2018年重大更新:
3)腾讯云数据库Redis/CKV+2018年重大更新:
4)腾讯云数据库CTSDB2018年重大更新:
2、Redis 4.0集群版商业化上线
2018年10月,腾讯云数据库Redis 4.0集群版完成邀测、公测、商业化三个迭代,在广州、上海、北京正式全量商业化上线。
产品特性:
使用场景:
官网文档:
https://cloud.tencent.com/document/proct/239/18336
3、腾讯自研数据库CynosDB发布,开启公测
2018年11月22日,腾讯云召开新一代自研数据库CynosDB发布会,业界第一款全面兼容市面上两大最主流的开源数据库MySQL和PostgreSQL的高性能企业级分布式云数据库。
本期新秀:京东云DRDS发布1.0版本
12月24日,京东云分布式关系型数据库DRDS正式发布1.0版本。
DRDS是京东云精心自研的数据库中间件产品,获得了2018年 ”可信云技术创新奖”。DRDS可实现海量数据下的自动分库分表,具有高性能,分布式,弹性升级,兼容MySQL等优点,适用于高并发、大规模数据的在线交易, 历史 数据查询,自动数据分片等业务场景,历经多次618,双十一的考验,已经在京东集团内大规模使用。
京东云DRDS产品有以下主要特性
1)自动分库分表
通过简单的定义即可自动实现分库分表,将数据实际存放在多个MySQL实例的数据库中,但呈现给应用程序的依旧是一张表,对业务透明,应用程序几乎无需改动,实现了对数据库存储和处理能力的水平扩展。
2)分布式架构
基于分布式架构的集群方案,多个对等节点同时对外提供服务,不但可有效规避服务的单点故障,而且更加容易扩展。
3)超强性能
具有极高的处理能力,双节点即可支持数万QPS,满足用户超大规模处理能力的需求。
4)兼容MySQL
兼容绝大部分MySQL语法,包括MySQL语法、数据类型、索引、常用函数、排序、关联等DDL,DML语句,使用成本低。
参考链接:
https://www.jdcloud.com/cn/procts/drds
RadonDB发布1.0.3版本
2018年12月26日,MyNewSQL领域的RadonDB云数据库发布1.0.3版本。
推出dbaplus Newsletter的想法
dbaplus Newsletter旨在向广大技术爱好者提供数据库行业的最新技术发展趋势,为社区的技术发展提供一个统一的发声平台。为此,我们策划了RDBMS、NoSQL、NewSQL、时间序列、大数据生态圈、国产数据库、云数据库等几个版块。
我们不以商业宣传为目的,不接受任何商业广告宣传,严格审查信息源的可信度和准确性,力争为大家提供一个纯净的技术学习环境,欢迎大家监督指正。
至于Newsletter发布的周期,目前计划是每三个月左右会做一次跟进, 下期计划时间是2019年4月14日~4月25日, 如果有相关的信息提供请发送至邮箱:[email protected]
感谢名单
最后要感谢那些提供宝贵信息和建议的专家朋友,排名不分先后。
往期回顾:
↓↓别忘了点这里下载 2019年1月 完整版Newsletter 哦~
‘叁’ 可以应对多种备份场景的统一备份一体机推荐一个
TStor 是腾讯云面向混合云场景打造的存储一体机产品系列。继年初公布对象存储一体机之后,该产品系列再添新成员:TStor B2000,是面向混合云备份场景的一体机产品。
依据权威咨询机构 IDC 和 Gartner 的预测,将来大部分企业的 IT 基础设施将基于混合云架构来构建,企业的利用和数据在云上云下同时存在,数据管理、数据保护和容灾更为简单,因而对数据保护产品提出了新的要求:
兼容公有云和私有云环境,做到云上云下灾备对立治理
具备高可扩展性,应答数据的海量增长
安全可靠,保证数据的安全性和备份业务的连续性
TStor B2000备份一体机,是一款基于混合云架构打造的,安全可靠、云边协同、开箱即用的数据保护平台。作为企业级数据安全爱护治理平台,反对对业务零碎的定时和实时备份、异地容灾、间断数据保护等性能,实用于操作系统、数据库、文件、虚拟机、云平台等利用,无效实现对业务零碎的全方位爱护。该产品的架构如下图所示:
性能个性
TStor B2000备份一体机的性能个性异样丰盛,能够笼罩各类企业应用备份需要:
多场景:面向传统数据中心、云计算、大数据三大场景,笼罩操作系统、数据库、文件、虚拟机、云平台等利用;
全方位:提供全生命周期的数据保护计划;
精细化:MySQL 数据库的热备份、Informix 数据库的热备份、Exchange 单邮件复原、Oracle事务级精准的复原和撤销等;
高效化:间断日志备份,RPO 趋近于0,根本不占用业务系统资源,帮忙用户实现更高效的数据保护。另外联合高效数据压缩和重删技术,极大地节俭了备份数据传输和存储老本;
除了丰盛的备份性能外,TStor B2000备份一体机还提供了弱小的云边协同性能,实用于公有云、私有云与混合云等多种企业IT架构,一套备份零碎即可同时治理云上云下的数据。
利用场景
TStor B2000反对如下场景:
本地备份:将本地业务数据备份至备份一体机,是典型的传统IT架构下的备份场景。
备份上云:本地业务的利用数据备份上云,实现数据异地备份及归档。
云上备份:应用备份一体机将私有云上的业务数据备份至云存储。
本地复原:将备份一体机或者云存储中的数据恢复至本地。
云上复原:本地数据中心故障后,应用云上资源搭建业务零碎并复原数据。
一个典型的混合云场景下的备份计划,就是上述5种场景的组合,既有本地业务数据的备份与复原,也有云上业务的备份与复原,同时数据能够在云上云下流动,其架构如下图所示:
为了最大水平保障备份数据的可靠性和备份业务的可用性,TStor B2000反对集群部署模式,由多个节点协同工作,数据跨节点冗余散布。在多个节点同时故障的状况下,备份数据仍然不会失落。另外,备份软件应用双机主备模式部署,主节点故障后,备节点主动拉起,接管主节点的备份业务,持续对外提供备份服务,保障了备份业务的连续性。
各型号比照
目前,TStor B2000备份一体机应用软硬一体的形式交付,开箱即用,提供图形化界面方便管理。产品有四种规格,分为单机版与集群版。单机版实用于中小规模的备份场景,性价比高。集群版实用于中大规模场景,具备高性能、高牢靠、横向扩大的能力。四种型号的具体规格如下表所示:
在企业向混合云架构转型的过程中,TStor B2000备份一体机以其安全可靠的架构,丰盛全面的个性,简略易用的设计,以及混合云场景下弱小的云边协同的性能,成为企业建设灾备计划的最佳抉择。
【腾讯云】云产品限时秒杀,爆款1核2G云服务器,首年50元
阿里云限时活动-2核2G-5M带宽-60G SSD-1000G月流量 ,特惠价99元/年(原价1234.2元/年,可以直接买3年),速抢
‘肆’ DTBase数据库一体机是否支持MySQL、PostgreSQL、SQL Server
是的,支持!
DTBase数据库一体机支持主流的数据库引擎(MySQL、PostgreSQL、SQL Server等),能将不同数据库资源整合,提供统一数据库运维平台,实现异构数据库的统一管理。除此之外还有以下优点:
1.数据安全数据安全
DTBase数梦数据库一体机采用分布式处理架构,根据用户数据和业务的增长情况而进行数据库的弹性扩展,可以从4个数据节点扩展到128个节点,并且在线实时修改生效,不影响应用程序,从根本上解决传统架构在性能、扩展性方面存在的难题。
2.高可用
DTBase数梦数据库一体机所有节点、部件均为冗余设计,不会因为单硬盘故障、单个节点故障、单台交换机故障导致业务停顿或数据丢失。并且通过多重备份机制来保证数据的高可用性,如本地磁盘存储、外挂磁盘,传输到远程数据中心以及云端的存储,保证数据的快速恢复。服务可用性>99.9%,数据可靠性>99.999%。
3.高安全
DTBase数梦数据库一体机具有独立的安全模块,能够为系统提供多维度的数据安全保护,包括IP白名单防护、流量控制、协议过滤、7层SQL注入解析和拦截,用户可对数据库进行细粒度授权,并具有完善的数据库审计功能。
4。兼容Oracle
DTBase数梦数据库一体机对Oracle的兼容度超过95%,包括SQL语法、存储过程、高级分析函数、窗口函数、嵌套事务控制、查询优化器等。良好的兼容性和完善的工具包在数据库迁移时可以大大节省工作时间,提高效率,并且减少对应用程序整改的工作量,降低业务迁移风险。
其DTBase数梦数据库一体机是杭州数梦工场科技有限公司(以下简称数梦工场)推出的自主可控的关系型数据库软硬件一体化产品,集数据存储、备份、高可用、迁移、监控、优化等功能为一体。DTBase以“数据库即服务DBaaS(DataBase-as-a-Service)”为设计理念,旨在帮助政府、金融、交通、医疗、教育、公安等行业的用户简化数据库运维管理,提升数据库性能,加快业务系统上线速度,为用户提供全栈式的云数据库解决方案。
‘伍’ 蓝海大脑的图数据库一体机怎么样
挺好的。相比关系型数据库,图数库是未来的趋势߅蓝海大脑的图数据库一体机提供软硬件整体解决方案。帆哪禅主要应用知识图谱,图数据科学,欺诈检测,客户360, 实时推荐,供应链管理等多缓散种场景态尘。
‘陆’ 数据备份一体机品牌有哪些
中科热备那个基于备份虚拟化技术的热备云系统。他他强调的就是热备份区别于传统的冷备份。在线生产数据或者在云计算数据中心。热数据直接备份出来。实现双云热备。他可以对这个数据库的数据,对这个操作系统,也可以对这个虚拟机,也可以对这个文件,然后呢做实时的热备份。同时呢,也可以备份到这个虚拟带库,物理带库, 蓝光,储存。云上。可以满足备份的黄金法则,321法则。热备云一体机,Hotbackup Clound,实时热备份,发展新趋势。满足数据安全法的合规性。
‘柒’ 数据库一体机与大数据技术区别何在
数据库一体机与大数据技术区别何在
作为近期信息管理领域最为热门的两项技术,数据库一体机与大数据技术的硬件架构基本相同,但软件体系有着本质的区别,这也导致了两者拥有不同的特征表现。
随着企业数据量的快速增长,以及用户对服务水平要求的不断提高,相当长的一段时间以来,传统关系数据库技术在生产实践中表现出明显的能力不足。如何以合理的成本获得海量数据的高可用性已经成为现代IT领域的重大挑战。为了应对这一挑战,近年来,IT市场中相继出现了许多新的技术手段,其中最为引人注目的便是由主流数据库厂商主导的数据库一体机(例如Oracle ExaData以及IBM Netezza等),以及以开源力量为主的大数据技术。
不过,虽然数据库一体机与大数据技术都是当今的热门话题,并都已经被广泛应用,但却有相当一部分用户仍然无法深入了解两者之间的本质区别与关系。同时,很多用户也在为如何在企业内部对这两者进行正确定位而感到困惑。为此,本文特别对数据库一体机(也可称新一代主流关系型数据库)和大数据技术(例如Hadoop,主要指MapRece与NoSQL)的相关技术特点进行对比。
硬件与软件
从本质上来讲,数据库一体机与大数据技术的硬件架构基本相同,同样是采用x86服务器集群的分布式并行模式,以应对大规模的数据与计算。但是,数据库一体机的卖家们通常会对其产品的硬件体系进行面向产品化的、系统性的整体调优,同时也会有各自的特色手段。比方说Oracle ExaData的Infiniband、Flash Cache,IBM Nettezza的FPGA(现场可编程逻辑门阵)等。[page] 数据库一体机与大数据技术最为核心的区别是在软件体系上。数据库一体机的核心是SQL体系,这不只是指SQL解析,更重要的是指包括SQL优化引擎、索引、锁、事务、日志、安全以及管理等在内的完整而庞大的技术体系。这一体系是成熟的、面向产品的。
大数据技术软件体系中的MapRece则提供了一个面向海量数据处理的分布式编程框架,使用者需要自行编制所需要的计算逻辑。MapRece对数据的读写是批量连续的,而不是随机的。而大数据技术的另一体系NoSQL则大都只是提供了海量数据的分布式存储,以及基于索引的快速读取机制,为使用者提供的大多是编程API(虽然也有类SQL的语言,但其本质并不是完整的SQL体系)。
由于SQL体系的复杂性与处理逻辑的整体关联性,导致数据库一体机在扩展性上远不及大数据技术体系,虽然前者已经在很大程度上改善了传统关系数据库垂直扩展的瓶颈。MapRece与NoSQL的单个集群往往可以扩展到数千个节点,而数据库一体机如果在硬件上扩展到这个规模,从软件上来讲,已经是没有意义的了。
特征与本质
基于软件体系的不同,导致了数据库一体机和大数据技术有着不同的特征表现。数据库一体机往往适合于存储关系复杂的数据模型(例如企业核心业务数据),并且需要限制为基于二维表的关系模型。同时,数据库一体机适合进行一致性与事务性要求高的计算,以及复杂的BI计算。
大数据技术则更适合于存储较简单的数据模型,并且可以不受模式的约束。因而其可存储管理的数据类型更加丰富。大数据技术还适合进行一致性与事务性要求不高的计算(主要是指NoSQL的查询操作),以及对超大规模海量数据的、批量的分布式并行计算(基于MapRece)。
需要注意的是,NoSQL数据库由于摆脱了繁琐的SQL体系约束,其查询与插入的效率比数据库一体机更高。大数据技术比数据库一体机所能处理的数据量也相对大些,这主要是因为其集群可以扩展得更大。
从本质上讲,MapRece是对海量数据分布式计算领域的一个重要创新,但也只是在适合于并行处理的大规模批量处理问题上更占优势,而对一些复杂操作,则不一定具有优势。NoSQL则可以看作是对传统关系数据库进行简化的结果。由于NoSQL数据库的设计思想只是提取出关系型数据库的索引机制,并加了上分布式存储,把SQL体系中那些对“某些特殊问题”而言并不需要的东西统统删去,由此实现了更优秀的效率、扩展性与灵活性。[page] 因此,我们可以明显地看到,在实践中,有很多问题(特别是流行的大数据问题),关系数据库中的许多设计并不需要,这才是NoSQL发展壮大的根本立足点。
关系与协作
通过前面的分析,我们不难得出这样的结论:大数据技术与数据库一体机应该是相辅相成,并非互相替代的。它们针对不同的应用场景设计,并相互补充与合作。具体来说,大数据技术可以实现:
■处理企业内海量的、模型简单、类型多样的非结构化与半结构化数据(例如社会化数据、各种日志甚至图片、视频等),其处理结果可以被直接使用;
■以上处理结果也同时可以被当成是新的输入存储到企业级数据仓库中,这时大数据机相当于是面向大数据源的、新的ETL(提取-转换-加载)手段;
■面向海量数据的、不太适合SQL的存储或计算。
而数据库一体机则应该还是作为企业数据仓库的主流技术,至少在很长一段时间内应该是这样。它负责存储与计算最主要的、有重大价值的企业关键业务数据。
现存的误区
有些人认为,虽然大数据技术的原始开源状态还不适合充当企业级数据仓库主平台的要求,但经过开发、补充,应该是可以的。其实这个观点没有错。但实际上,对开源的大数据技术进行补充开发,所要补充的正是大数据技术在原始设计上就去除了的、那些本属于关系型数据库体系的东西。
如果进行这样的补充开发,企业不仅会面临庞大的、难于估计的开发工作量,同时也难以像专业数据库厂商那样实现这些工作的理论化、产品化与体系化。虽然从纯技术的角度上讲,开发什么都有可能。但是如果企业真的准备这样做,是要开发另一个商业化的关系数据库吗?很明显,这违背了大数据技术的设计初衷。
‘捌’ 数据库一体机和数据库的区别
数据库一体机和数据库的区别如下。
1、数据库一体机往往适合于存储关系复杂的数据模型(如企业核心业务数据),并且需要限制为基于二维表运模的关系模型。同时适键悄脊合进行一致性与事务性要求高的计算。
2、数据技术则更适合于存储较简单的数据模型,稿渗并且可以不受模式的约束。
‘玖’ 在项目数字化转型中使用较为普遍的软件定义存储一体机有吗,求推荐
随着国内企业数字化转型加速,企业纷纷上云,数据存储量呈爆发式增长。传统存储扩展性差、成本高等局限性愈发明显。软件定义存储(Software Defined Storage,以下简称SDS)以虚拟化方式将各种存储资源抽象化、进行池化整合,通过智能化管控软件实现存储资源的按需分配。软件定义存储重新定义了存储架构,以扩容便捷、成本较低等优势,成为存储领域的重要发展方向之一。
深圳市杉岩数据技术有限公司(以下简称“杉岩数据”或“杉岩”)是国内软件定义存储领域的领导者之一。IDC最新发布的《2019 Q4 中国SDS市场报告》中,杉岩数据在对象存储市场份额第三,占比16.3%;在块存储市场份额第四,占比6.9%。
杉岩数据成立于2014年9月,公司以新一代智能分布式存储技术为核心,致力于提供领先的面向不同业务环境的企业级存储方案,帮助用户轻松应对IT向云迁移的存储挑战,为大数据时代的商业决策提供智能存储,打造云计算、人工智能、物联网等领域的数据存储基石。
杉岩数据致力于帮助用户应对数据存储量、访问量以及数据管理复杂度,帮助用户建立以存储虚拟化和计算虚拟化为核心的云计算基础设施环境,并逐步提供数据处理、挖掘、智能分析等方面的大数据专业系统和服务。
2020年7月8日,公司宣布获得B+轮1.5亿元最新融资,本轮融资由大型央企中远海运领投,襄禾资本、无锡金投跟投。借助本轮融资,公司将围绕数据存储、数据管理、数据价值的客户价值模型,持续加大产品关键技术的研发投入、垂直领域的市场拓展、人才引入以及产业生态链的建设,为用户的数字化转型提供全面赋能。
杉岩数据融资情况
访谈内容分享如下:
1
不只是存储优化
以数据为中心的客户价值金字塔模式
将智能存储的进阶赋能演绎到极致
融中研究:
“SandStone是一种橙红色石头,由沙粒经过多年不断沉积重新排列而成。SandStone 生动地诠释了‘分布式架构’的形成。”为什么用这个比喻来强调“分布式架构”?有什么特殊含义?
陈坚:
SandStone对我们确实意义深远。实际上,我们公司名称的来源与“Sand Stone”紧密相关。杉岩二字,来源于Sand的音译杉,以及Stone的意译岩。取名“SandStone”是因为我们做的是基于P2P的分布式存储架构,分布式存储的本质就是把分散的磁盘硬件聚合起来,形成一个很大的存储资源池。“SandStone”生动地诠释了“分布式架构’的形成,每个磁盘所在的服务器节点就像一粒沙子,通过杉岩数据的软件聚沙成石,形成一个稳定可靠的存储系统。
SandStone不仅代表了产品的特点,实际也代表了我们的文化、经营理念。从公司内部来看,每一个员工就像一粒沙子,大家团结奋斗、紧密协作,凝聚成一个有机整体,使得整个公司像石头一样坚不可摧;从外部合作伙伴的拓展来看,以杉岩为中心,将周围的合作伙伴聚在一起形成生态圈,每一个伙伴也是一粒沙子,通过不断吸纳聚合,构建稳定的生态圈。因此,SandStone所代表的团结奋斗与凝聚力内核,已内化成了公司企业文化的一部分;SandStone蕴含的分布式理念,也切合了公司与合作伙伴的生态建设理念。
融中研究:
杉岩是做存储的,为什么公司取名为杉岩数据而不是杉岩存储呢?智能存储与传统存储的主要区别是什么?杉岩的智能存储方案有什么特点?
陈坚:
之所以叫杉岩数据而不是杉岩存储,是因为我们带给客户的价值不只是存储的优化,而是以数据为中心的智能存储赋能,通过我们的存储系统,解决客户在AIoT、5G时代海量数据的存储、管理以及使用方面的问题。
针对智能存储,杉岩数据构建了一套以数据为中心的客户价值金字塔模型,最底座是存储,作为数据的抓手;中间层是数据的管理,作为内涵;最顶层为未来的智能化应用提供准备及服务,我把它叫做外延。
具体来说,第一层即数据存储的智能化。存储侧的智能,就是让客户使用更加简单。传统存储像烟囱,每一个业务系统配一套存储,客户的运维非常困难。分布式存储则是一个存储池,客户面向的是一套承载了不同应用数据的存储集群,孤立的烟囱不再存在。在存储集群里面的故障、性能、容量等告警,都是由存储系统内部智能化完成,同时还保障数据的可靠性、安全性以及访问性能。
第二层,数据管理的智能化。用户存数据后,要管数据。我认为数据是有生命力的,像人一样有从生到死的过程。医疗影像数据是一个典型的例子:病人拍完CT、X光产生的影像数据马上要被用于辅助医生寻找病症、病灶,这时数据是“热”的。这一次病好后,数据访问频率下降,“热”数据变为“温”数据。病人彻底康复后,数据变“冷”。对“热”数据,为了保证访问性能,相应的软硬件配置都非常高,价格也高。“冷”数据如果同“热”数据一样存储,性价比较低。医院一般将冷数据归档到公有云或蓝光等单位存储成本相对较低的存储介质中。这个例子正好反映了数据全生命周期的智能化管理。
在未来海量数据时代,数据的管理非常关键。除了数据全生命周期的管理,杉岩还能实现数据智能化的统一管理,包括:对客户的传统存储和杉岩的分布式存储的统一管理,保护客户对传统存储的原有投资;对公有云、私有云数据的统一管理,实现数据的自由流动;对边缘设备与中心设备数据的统一管理,实现数据的相互协同。
第三层,金字塔的顶端,是数据挖掘的智能化。数据被存储、管理,最终都是为了信息和价值的挖掘。目前越来越多的企业借助AI、机器学习、深度学习这些算法来使用和挖掘数据价值。杉岩的存储系统,包括我们的对象存储,都为海量数据的挖掘和使用去赋能。当然,杉岩不是要做AI,而是为智能化去赋能。这体现在两个方面,第一,我们的存储系统里面自带数据处理引擎,对业务需要使用的数据进行预先处理。第二,我们为AI的训练、数据清洗、数据的准备阶段提供了友好的统一管理、存储平台——数据处理引擎“AI in MOS”,还有面向需要对AI进行训练、学习、应用的公司提供的存储平台——“MOS for AI”。
融中研究:
杉岩在数据的存、管、挖各个层面的资源投入如何?杉岩在技术底层的优势有哪些?
陈坚:
在存、管、挖三个层面,杉岩起步聚焦于“存”,致力于为客户提供一个高可靠、高安全、高性能、高可扩展性的分布式存储系统,“存”也是目前投入最大的一块。在“存”方面,目前我们的核心竞争力主要体现在产品性能更高,可用性、可维性更强,特别是在数据的安全性方面,我们积累了很多经验。
在管方面,随着客户持续增加,杉岩面临的需求也不断增加,我们通过与客户的互动交流,了解客户实实在在的需求与痛点,并提出创新的解决方案。目前我们一些特有的产品功能已经落地了,这是很多企业包括一些大厂都不具备的,比如说我们对传统存储与分布式存储的统一管理、对数据的全生命周期管理等等。
最上层,未来数据的智能应用层面,在智能数据处理引擎“AI in MOS”产品上,我们也在加大投入,今年就会有实际的项目落地。
融中研究:
您刚才讲到,在数据挖掘上会加大投入,那么杉岩在这一块的发展目标如何?如何与数据挖掘专业公司竞争?
陈坚:
我先做一个澄清,杉岩的产品是有边界的,我们不会像大数据公司一样,比如也去做一个精准营销,我们是为精准营销赋能。像之前提到的数据处理,即使杉岩不做,这些公司还是要做的,杉岩其实是在帮这些公司做加速。另一方面,在赋能大数据挖掘的过程,杉岩主要针对非结构化数据赋能。以前的基于数据库的结构化数据,像BI、数据仓库,这类数据的挖掘已经有非常成熟的解决方案,杉岩的目标不在于此。我们强调对象存储就是因为对象存储是存储非结构化数据最佳的载体。我们通过对非结构化数据的AI挖掘、使用赋能实现差异化。
融中研究:
在当前软件定义存储,存在哪些技术局限,大概何时能够突破?杉岩在这块有哪些领先优势?
陈坚:
软件定义存储的概念相对于传统存储,其设计哲学和传统存储刚好相反。传统存储以硬件为核心,存储系统的数据可靠性高度依赖硬件架构的设计。软件定义存储,假设硬件是不可靠的或可靠性没那么高。
软件定义存储的性能更高、扩展性更强、更灵活。但任何一个架构、系统都会有自己的优缺点。软件定义存储在技术上的局限性:第一,难以将硬件的性能发挥到极致。第二,在存储集群大了以后,整个集群的管理、运维也是一个挑战。一般的企业没有专门的IT运维人员或运维水平有限,在海量数据时代,存储产品能不能让企业实现简单运维,也是一个挑战。
杉岩对传统存储和分布式存储都有很深入的理解,既有传统存储最核心的架构师和工程师,也有深耕分布式存储领域近10年的架构师。面对这些局限,杉岩也在做一些事情,比如在软硬结合方面,与硬件供应商一起做软硬垂直优化;在大规模集群存储系统的管理和运维上,借鉴一些AI的算法能力,让运维更加智能化、自动化。
2
立足场景寻找最佳匹配行业
以质量和服务构建客户信任
加速市场拓展
融中研究:
杉岩已服务10+行业的500+客户,从市场策略来看,杉岩数据在这些行业是齐头并进还是有所侧重?主要的优势行业有哪些?未来发展或者延伸的重点行业还有哪些?
陈坚:
存储系统作为一个标准化产品,没有太多的行业属性。但是软件定义存储有它的最佳应用场景。
杉岩数据依托场景构筑产品和解决方案,再通过最佳应用场景去寻找最佳匹配行业,进行市场开拓。例如,杉岩智慧视频云存储的解决方案,可以在安防、轨道交通、能源、电力、金融等等行业领域使用。另外,我们还推出了一个更加通用化、平台式的私有云产品,适用于金融、政府、教育、医疗等多个行业。
目前,杉岩市场突破的重点在于有大量场景和需求的政府、金融、教育、医疗、交通、能源、制造等行业。市场开拓方面,杉岩在大部分行业齐头并进,对小部分行业有所侧重,例如金融行业将是杉岩数据始终关注的重点行业。
作为存储厂商,杉岩产品的行业属性不强,但在产品智能化层面,实际上我们有一些场景化和行业属性的定制,但这种定制不是为某一客户定制,而是为一个行业定制,并且可以批量复制和推广。
融中研究:
杉岩数据如何切入客户,并获得客户的信任?在客户关系维护和服务方面,杉岩数据采取哪些措施?
陈坚:
从0到1的突破是非常难的。杉岩数据以产品为客户带来的价值来切入市场,早期的客户包括中国移动、中国电信、广发证券、深圳市供电局等。对TOB市场,标杆的意义重大。杉岩切入市场后,依托案例与标杆客户在同行业去推广复制。
杉岩数据依靠高质量的产品和切实的服务获取客户的信任。目前为止,我们存储了2500+PB的数据,从没丢失过数据,这一点让用户非常放心。服务,是创业公司最具竞争力的优势之一,而大厂流程非常复杂,对TO B客户服务的理念和经验也比较缺乏。杉岩与客户的运维人员紧密沟通,对他们进行多维培训赋能,客户能够亲身感受到杉岩对他们的重视。
3
疫情期间,驰援武汉
推出免费服务平台
苦练研发内功蓄势待发
融中研究:
此次疫情对杉岩数据带来什么影响?杉岩数据采取哪些行动?
陈坚:
这次新冠疫情对杉岩数据是一把双刃剑,但总体来说是利好的局面。一方面,疫情对公司短期的获客、工作开展产生了一定的冲击和影响;另一方面,疫情也让新一代信息技术的价值被充分认识,例如远程医疗、远程诊断等会涉及到大量的数据存储和应用,轨迹、跟踪、健康码等其实也都是基于数据的存储和使用。很多行业对于新一代信息技术的接受程度更高了,特别是政府的智慧城市、医疗领域的远程医疗、教育领域的远程教育发展等,带来的数据存储机会更多了。
作为一家创业公司,疫情期间,我们也秉承一贯的家国情怀和责任,进最大的努力为抗疫提供支持。2月份,我们给武汉大学人民医院捐献了一套分布式存储产品,助力提升医院的医疗质量和效率。同时,为了帮助用户解决疫情期间存储问题,我们推出了供用户免费使用的“统一存储平台软件SandStone USP”。
此外,我们在产品研发、市场开拓上没有丝毫懈怠。在产品研发端,我们借机苦练内功、打磨产品,为疫情过后的市场反弹做好准备;在市场开拓方面,我们的销售团队通过远程电话保持与客户、合作伙伴的紧密互动与沟通,努力介绍杉岩的产品方案和价值亮点,积极拓展新客户、挖掘老客户新需求等。
4
分布式存储市场将形成寡头垄断格局
杉岩将始终以差异化取胜
融中研究:
当前存储市场竞争格局怎么样?主要玩家类型有哪些?
陈坚:
从市场格局来说,存储行业技术门槛很高,需要大量的经验积累和打磨,大浪淘沙之后,最终玩家不会很多。在传统存储领域,全球TOP6的公司占据市场百分之八十几的份额。在分布式存储领域,经过五年多的发展,与杉岩数据同期创立的公司中,很多技术不成熟的公司已经慢慢被淘汰了。我相信经过震荡式的发展后,分布式存储的市场格局会趋于稳定,也会变成一个寡头垄断的格局,未来会有一家或几家来占领市场绝大部分的份额,杉岩肯定是其中之一。
从竞争来说,杉岩的优势还是产品。创业公司没有捷径可走,品牌、资金都比拼不过大厂,生存发展一定是靠差异化的竞争力。杉岩的差异化竞争优势主要体现在客户价值金字塔模型的“管”和“挖”,“存”大家都在做,如果这一层都做不好自然会被淘汰;“管”层面,大厂的产品很全,内部对于传统存储和分布式存储会有一些博弈和竞争,但对于垂直用户定制化以及工业化需求领域不一定愿意涉足,而杉岩独特的价值和优势正体现于此。数据智能层面,杉岩的价值和优势更加明显。杉岩的设备产品有一些特殊的功能,这是很多大厂不会去做的事情,他们提供的主要是面向全球市场的标准化产品,聚焦于存储产品的完善。杉岩则是针对垂直细分市场进行产品差异化。
在市场竞争格局中,同类创业公司竞争方面,从目前来说,2013到2015年成立的一批公司,现在的竞争格局越来越清晰了。当前,软件定义存储处于繁荣发展期,蛋糕还没有定型,在不断扩展、挖掘客户新场景、新需求的阶段,都在共同培育市场。所以,我们正在共创生态链,携手合作伙伴建设新型IT基础设施建设。
融中研究:
大型厂商加码存储,例如华为、华三等大厂也开始发力对象存储,对杉岩数据的发展会有冲击吗?杉岩数据如何平衡与基础设施合作伙伴华为的竞争与合作?
陈坚:
大厂确实在加大对存储领域的布局,但我们也看到一个趋势,大厂现在主要在公有云方面布局,而在私有云方面,可能更多的是以传统存储、分布存储的架构来拓展市场。与大厂的竞争要避免正面交锋,走差异化路线。比如在金融领域,杉岩在智能化数据处理方面独具特色,这是我们带给客户的独特价值。
‘拾’ 微软的大数据解决方案_微软数据分析
在微软的大数据解决方案中,数据管理是最底层和最基础的一环。
灵活的数据管理层,可以支持所有数据类型,包括结构化、半结构化和非结构化的静态或动态数据。
在数据管理层中主要包括三款产品:SQLServer、SQLServer并行数据仓库和
HadooponWindows。
针对不同的数据类型,微软提供了不同的解决方案。
具体来说,针对结构化数据可以使用SQLServer和SQLServer并行数据仓库处理。
非结构化数据可以使用WindowsAzure和上基于Hadoop的发行版本处理;而流数据可以使用SQLServer管理,并提供接近实时的分析。
1、SQLServer。去年发布的SQLServer2012针对大数据做了很多改进,其中最重要的就是全面支持Hadoop,这也是SQLServer2012与SQLServer2008最重要的区别之一。今年年底即将正式发布的SQLServer2014中,SQLServer进一步针对大数据加缓氏入内存数据库功能,从硬件角度加速数据的处理,也被看为是针对大数据的改进。
2、SQLServer并行数据仓库。并行数据仓库(,简称PDW)是在SQLServer2008R2中推出的新产品,目前已经成为微软主要的数据仓库产品,并将于今年发布基于SQLServer2012的新款并行数据仓库一体机。SQLServer并行数据仓库采取的是大规模并行处理(MPP)架构,与传统的单机版SQLServer存在着根本上的不同,它将多种先进的数据存储与处理技术结合为一体,是微软大数据战略的重要组成部分。
3、HadooponWindows。微软同时在WindowsAzure平台和WindowsServer上提供Hadoop,把Hadoop的高性能、高可扩展与微软产品易用、易部署的传统优势融合到一起,形成完整的大数据解决方案。微软大数据解决方案还通过简单的部署以及与ActiveDirectory和SystemCenter等组件的集成,为Hadoop提供了Windows的易用扰键散性和可管理性。凭借WindowsAzure上基于Hadoop的服亮闭务,微软为其大数据解决方案在云端提供了灵活性。