存储池化
1. 软件定义存储的概念是什么
SDS 的全称是 Software Defined Storage ,字面意思直译就是软件定义存储。关于 SDS 的定义可以参考全球网络存储工业协会(Storage Networking Instry Association,SNIA),SNIA 在 2013 正式把 软件定义存储(SDS) 列入研究对象。
SNIA 对软件定义存储(SDS) 的定义是:一种具备服务管理接口的虚拟化存储。 SDS 包括存储池化的功能,并可通过服务管理接口定义存储池的数据服务特征。另外 SNIA 还提出 软件定义存储(SDS) 应该具备以下特性:
自动化程度高 – 通过简化管理,降低存储基础架构的运维开销
标准接口 – 支持 API 管理、发布和运维存储设备和服务
虚拟化数据路径 – 支持多种标准协议,允许应用通过块存储,文件存储或者对象存储接口写入数据
扩展性 – 存储架构具备无缝扩展规模的能力,扩展过程不影响可用性以及不会导致性能下降
透明度 – 存储应为用户提供管理和监控存储的可用资源与开销
详细内容可关注SmartX技术博客《超融合、软件定义存储(SDS)、分布式存储以及Server SAN的区别与联系》
2. 软件定义存储,什么是软件定义存储
什么是软件定义存储(SDS)(参考资料:网络:SDS)
SDS 软件通过虚拟数据平面对底层存储进行抽象化,这使得虚拟机(和应用)成为了存储调配和管理的基本单元。通过在应用和可用资源之间实施灵活的隔离措施,常见的 hypervisor 可为应用均衡分配所需的全部 IT 资源(包括计算、内存、存储和网络连接)。
软件定义存储 vs.传统存储架构
虽然没有官方的定义,但软件定义存储就是将存储硬件中的典型的存储控制器功能抽出来放到软件上。这些功能包括卷管理、RAID、数据保护、快照和复制等。软件定义存储允许用户不必从特定厂商采购存储控制器硬件如硬盘、闪存等存储介质。并且,如果存储控制器功能被抽离出来,该功能就可以放在基础架构的任何一部分。它可以运行在特定的硬件上,在hypervisor内部,或者与虚机并行,形成真正的融合架构。
软件定义存储特点
SINA 还提出 软件定义存储(SDS) 应该具备以下特性:
自动化程度高 – 通过简化管理,降低存储基础架构的运维开销
标准接口 – 支持 API 管理、发布和运维存储设备和服务
虚拟化数据路径 – 支持多种标准协议,允许应用通过块存储,文件存储或者对象存储接口写入数据
扩展性 – 存储架构具备无缝扩展规模的能力,扩展过程不影响可用性以及不会导致性能下降
透明度 – 存储应为用户提供管理和监控存储的可用资源与开销
您可以自行选择运行存储服务的硬件。您所选购的 SDS 和硬件不一定要来自同一家公司。您可以使用任意商用或 x86 服务器来构建基于 SDS 的存储基础架构。这意味着,您可以充分利用现有硬件来满足不断增长的存储需求,
从而做到经济高效。SDS 采用了横向扩展(而非纵向扩展)的分布式结构,允许您对容量和性能进行单独调整。
您可以加入大量数据源,以构建自己的存储基础架构。您可以将目标平台、外部磁盘系统、磁盘或闪存资源、虚拟服务器以及基于云的资源(甚至是工作负载的专用数据)连接到同一网络中,以创建统一的存储宗卷。
SDS 可以基于您的容量需求自动进行调整。由于 SDS 不依赖于硬件,所以 SDS 的自动化也可自动实现,可从连接的任意存储宗卷中调取数据。这种存储系统可以根据数据需求和性能进行调整,且无需管理员干预,也无需添加新的连接或硬件。
不存在任何限制。传统的存储区域网络受限于可用的节点(已分配 IP 地址的设备)数量。从定义来看,SDS 不存在类似限制。这意味着,在理论上,SDS 可以无限扩展。
容器:通过在容器应用中运行持久存储,更加充分地利用您的容器应用;或者,通过在容器中运行 SDS,更加充分地利用您的存储。
云基础架构:支持私有云、公共云和混合云架构,并能实现所需的敏捷性和可扩展性。
大数据分析:快速安全地分析大型数据湖,以提升业务洞察力。
超融合基础架构:消除离散存储层,并能与您企业中的各种虚拟化服务器实例搭配使用。
对象存储:灵活可靠地存储、备份和检索 PB 级的数据。
富媒体:您的富媒体存储会日益扩展,因为您总是需要更多内容。
软件定义存储优势
软件定义存储用途
3. “东数西算”全面启动:数据大迁徙背后,看见存储产业的未来轮廓
近日,国家发展改革委等部门联合印发文件,同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏启动建设国家算力枢纽节点,并规划了10个国家数据中心集群。至此,全国一体化大数据中心体系完成总体布局设计,“东数西算”已成为国家级战略工程,浩浩荡荡地站上了 历史 舞台。
“东数西算”被认为是继“南水北调”“西电东送”“西气东输”之后的又一重大基础设施工程,将成为“新基建”的新抓手。具体而言,“东数西算”就是将东部产生的数据和需求,放到西部数据中心去计算和处理。这有利于为数据中心提供源源不断的可再生能源,大幅降低其运行维护成本,同时能够推动中国数字经济和西部地区发展。
乘着“东数西算”的政策东风,存储、计算产业也将迎来巨大的发展机遇。其中,基于分布式存储架构的SDS(软件定义存储)作为先锋力量、“热门选手”,天生具有可扩展性以及灵活性,必然会为新基建时代带来革命性的数据储存手段。
然而,机遇往往与挑战并存,一个不能忽略的问题是,随着东数西算工程纵深推进,存储需求激增,同时5G、AI、云等技术加速更迭的背景下,与之相伴而生的SDS由于还在沿用十年前的技术,也必然需要同频进化。
01
被行业拥簇的SDS(软件定义存储)
2013年,“软件定义一切”被首次提出时,还是个令人怀疑的技术畅想。尤其是当它与存储绑定在一起,在一些传统储存厂商眼里是不着边际的。但事实证明,SDS(软件定义存储)的诞生,不仅优化了传统存储的弊端,并在日后的十年里逐渐繁荣。
根据IDC公布的2021年三季度中国软件定义存储(SDS)市场报告显示,前三季度中国SDS市场获得高速增长,市场规模同比增长54%,成为中国存储市场的增长引擎。早就发布过软件定义是趋势的Gartner预测,到2024年,全球50%的存储容量将以软件定义存储的形式部署,包括本地部署或在公有云上。
SDS在市场上的狂飙突进,一方面是基于创新技术。近几年,由于数据爆炸式增长,存储系统的软硬件紧耦合设计严重地限制了存储技术的发展,而软件定义存储则可以实现软硬解耦,让硬件成本尽可能的降低,使得软件发挥更大价值。通过软件的设计,来决定存储的性能和边界,不用再受硬件设备、服务器的限制。其方向在于帮助用户在传统数据中心或云内实现存储资源的池化和服务化,以及在多云之间实现数据的统一管理和自由流动。
另一方面,是源于 历史 的进程,被时代选择。随着云计算、大数据和人工智的发展,非结构数据爆发式增长——文本、图像、影视、超媒体等,面对这些数据,传统存储方式难以招架,而SDS存储正是包含针对文件的存储、对象的存储,自然就成了相关行业的首选。此外,企业云化在近几年成为了主流。在上云浪潮下,不同种类业务在池化的资源池中拿到相匹配的资源。这种业务场景天然适合软件定义存储的分布式架构、软件定义、水平扩展、基于统一存储引擎向上提供多种接口等特性。
02
SDS已站在新十年的转弯处
带着这样的优势,伴随着行业的拥簇,SDS转眼已来到新十年的转弯处。周遭环境飞速变化,数字浪潮奔腾汹涌,一些厂商、企业赫然发现,这个阶段的SDS竟然依然处于1.0时代,还在沿用十年前的开源技术,基于旧的硬件架构设计,似乎已无法更好的应对未来的新兴需求。
例如,与10多年前相比,现在的存储硬件、网络以及相关的技术方案已经发生了很多的变化,如果在软件层面不做出新的变革,数据存储系统就无法发挥出最大的价值。
还有介质方面,存储已经实现了大规模的从机械硬盘向SSD固态硬盘的过渡,由此带来了超高的IOPS、超低的时延;网络的提升更是惊人,100G已经司空见惯,400G也已经渐行渐近。
当然,也面临着“云”的追赶。我们都知道,目前,企业云化已经成为必答题,云的发展日新月异,从私有云到多公有云、边缘云、分布式云,企业选择上云的部署方式越来越多元,数据可能存放在任意的地理位置,存储平台需要构建全局统一的存储资源池,让数据在多数据中心、混合多云和边缘中按需流动,这都是目前SDS1.0需要突破的挑战。
03
触摸存储未来的轮廓,ExponTech抢先迈向SDS2.0
作为数据基础设施整体解决方案提供商—ExponTech华瑞指数云率先提出SDS2.0概念。在ExponTech看来,SDS从1.0需要迈向2.0时代,进化为2.0后,会为行业带来眼前一新的改变。
比如,SDS 2.0将支持可组合式架构,整合私有云、多个公有云,边缘云中的存储资源,提供不同IO模型,不同性能和可靠性要求以及许多种协议接口(iSCSI、S3、POSIX、NFS、CIFS、CSI、HDFS等)的自由组合及灵活部署使用。
还有,SDS2.0将与云原生高度协同。无论在计算、网络、数据亦或业务的层面,都可以按照云原生的架构模式、部署模式和运营模式,实现与时俱进的进化。SDS 2.0需要按照云原生的方式,支持和适配企业云原生应用的发展。
最后,具备向上服务能力。SDS2.0在做好基础存储的服务、流动的同时,还会向上管理数据库,分发数据,帮助企业解决数据孤岛问题。
不仅如此,ExponTech认为,SDS2.0未来近乎要实现一个飞跃式的革新,是需要在引擎和架构方面做出全新的设计。
由此,ExponTech前瞻性地发布自主研发的新一代分布式数据存储引擎WiDE。和其他存储相比, WiDE既可以提供多池架构下的IO调度和数据流动,企业可以存储海量非结构数据,也能存储要求高性能高可靠的结构化数据,还可以做高性能的数据分析,真正实现数据原生于一个数据平台上,只保留一份数据却可以被各类应用以各种接口访问,避免各种数据孤岛和数据复制拷贝带来的问题。
此外,WiDE还全面覆盖数据新基建创新型应用场景。在覆盖现有分布式存储产品SDS1.0的主流业务场景之外, WiDE能在高性能数据分析HPDA、高性能云主机、高性能数据库底座、混合多云数据平台等业务场景发挥作用,弥补之前高端应用场景下吞吐和时延的缺陷。
引擎WiDE的问世,将会在SDS2.0时代更好地帮助企业应对数字化时代面临的业务快速迭代升级的需求,推动企业智能化。未来,ExponTech也将会打造更多前沿存储产品,助力国内数据存储和国产系统软件的发展。
伴随着对SDS2.0的展望和引擎WiDE的无限可能性,未来之窗的纱帘正在缓缓拉开,我们对于数字世界广阔前景的想象,变得更为具体可感了。
END
4. 听说了VMware vSAN,这个产品简单介绍一下好吗
参考VMware官网介绍:
vSAN 是企业级存储虚拟化软件,与vSphere结合使用时,可让您通过单个平台管理计算和存虚伏储。借助 vSAN,您可以降低传统存储高昂的成本和较高的复杂性,通过最简单的方法实现超融合基础架构弊帆和混合云。采用基于 vSAN 的集成式超融合基础架构 (HCI) 解决方案,可以在加快运维速度并降低成本的同时提高业务敏捷性。
目前新基建与IT国产化的浪潮下,原来越多的企业开始考虑基于SMTX ZBS之差卜携类的国产企业级存储虚拟化软件,实现底层存储池化,并进一步构建新一代超融合基础架构。
5. 超融合架构(HCI)和软件定义存储(SDS)的关系
很简单,HCI 是一室一厅(同时扮演着客厅,书房,卧室的角色)适合小规模分支机构,从业务的角度一个应用一套系统,整合了计算,存储,网络
SDS 是四室两厅,每个房间都有自己独立的功能,适合大型企业,适合多业务场景,文件,块,对象,大数据HDFS需求
业务部门喜欢HCI,一套集群搞定,IT 运维和基础架构部门,喜欢SDC,SDS,SDN 拆分部署,计算,存储资源容易量化
HCI 的弊端是选择一个厂家的HCI,比如虚拟机是KVM就没法再选择 VSPHERE ,计算跟存储无法分开扩容,不适合30个节点以上的集群需求,实际上HCI的案例,大部分都是30节点以内一个集群,如果有大型案例,用户一般都会拆分到很多个集群去管理,SDS 比较好的厂商,一个集群200个节点很常见,比如电信全球眼,移动咪咕,这些基于SDS架构的平台,20PB 是常见容量,这些应用不适合采用 HCI
6. 听说浪潮联合三星推出了全闪存储资源池化解决方案,有人了解是怎么回事吗
在第二届开放计算中国社区技术峰会中浪潮信息联合三星推出了基于1U服务器的开放全闪存储资源池化解决方案,采用新的Ruler SSD,基于EDSFF标准(企业与数据中心存储形态),1U空间可以实现闪存容量最高可达256TB,支持通过NVMeoF技术实现闪存储资源的远程共享,同时也适用于本地大容量高性能存储解决方案。随着新技术的不断渗透及应用,企业业务发展对数据采集和处理的速率要求也越来越高,系统对高性能、大容量的存储解决有更高诉求,需要引入高性能存储才可以实现系统平衡,在此情况下,浪潮信息开始与三星合作,共同打造了开放全闪存储资源池化解决方案。
7. 软件定义存储的概念是什么
什么是软件定义存储(SDS)(参考资料:网络:SDS)
SDS 软件通过虚拟数据平面对底层存储进行抽象化,这使得虚拟机(和应用)成为了存储调配和管理的基本单元。
通过在应用和可用资源之间实施灵活的隔离措施,常见的 hypervisor 可为应用均衡分配所需的全部 IT 资源(包括计算、内存、存储和网络连接)。
软件定义存储 vs.传统存储架构
虽然没有官方的定义,但软件定义存储就是将存储硬件中的典型的存储控制器功能抽出来放到软件上。这些功能包括卷管理、RAID、数据保护、快照和复制等。软件定义存储允许用户不必从特定厂商采购存储控制器硬件如硬盘、闪存等存储介质。并且,如果存储控制器功能被抽离出来,该功能就可以放在基础架构的任何一部分。它可以运行在特定的硬件上,在hypervisor内部,或者与虚机并行,形成真正的融合架构。
软件定义存储特点
自动化:管理得到简化,成本也随之下降。
标准接口:用于管理和维护存储设备和服务的应用编程接口 (API)。
虚拟化数据路径:可通过应用写入数据的块、文件和对象接口。
可扩展性:能在不影响性能的情况下横向扩展存储基础架构。
透明:能够监控并管理存储空间的使用情况,并清楚知晓有哪些可用资源以及相应的成本。
您可以自行选择运行存储服务的硬件。您所选购的 SDS 和硬件不一定要来自同一家公司。您可以使用任意商用或 x86 服务器来构建基于 SDS 的存储基础架构。这意味着,您可以充分利用现有硬件来满足不断增长的存储需求,
从而做到经济高效。SDS 采用了横向扩展(而非纵向扩展)的分布式结构,允许您对容量和性能进行单独调整。
您可以加入大量数据源,以构建自己的存储基础架构。您可以将目标平台、外部磁盘系统、磁盘或闪存资源、虚拟服务器以及基于云的资源(甚至是工作负载的专用数据)连接到同一网络中,以创建统一的存储宗卷。
SDS 可以基于您的容量需求自动进行调整。由于 SDS 不依赖于硬件,所以 SDS 的自动化也可自动实现,可从连接的任意存储宗卷中调取数据。这种存储系统可以根据数据需求和性能进行调整,且无需管理员干预,也无需添加新的连接或硬件。
不存在任何限制。传统的存储区域网络受限于可用的节点(已分配 IP 地址的设备)数量。从定义来看,SDS 不存在类似限制。这意味着,在理论上,SDS 可以无限扩展。
容器:通过在容器应用中运行持久存储,更加充分地利用您的容器应用;或者,通过在容器中运行 SDS,更加充分地利用您的存储。
云基础架构:支持私有云、公共云和混合云架构,并能实现所需的敏捷性和可扩展性。
大数据分析:快速安全地分析大型数据湖,以提升业务洞察力。
超融合基础架构:消除离散存储层,并能与您企业中的各种虚拟化服务器实例搭配使用。
对象存储:灵活可靠地存储、备份和检索 PB 级的数据。
富媒体:您的富媒体存储会日益扩展,因为您总是需要更多内容。
软件定义存储优势
软件定义存储用途
8. 选择软件定义存储/分布式存储还是超融合一体机
肯定选择分布式存储,非常强调数据安全性,可以规避很多硬盘、服务器损坏、静默数据损毁等常见数据丢失风险。如果是普通的中小企业,主要部署一些静态网站,存储需求量不大,对数据安全性要求不高,能够容忍一定的数据丢失风险的,可以用超融合一体机。我们司负责IT的就10来个人,采用的VMware虚拟机加元核云分布式统一存储的方案
9. 池化是什么意思
指存储池化概念。
存储池化概念的提出不始于存储虚拟化技术,在存储从服务器直联存储到以SAN或者NAS为代表的网络存储的发展过程中,就提出了池化的概念。
借助池化,网络存储可以有效提升存储的利用率。因此,从直联存储向网络存储的发展过程,从技术上看,就是一个磁盘池化的过程。JBOD也好,RAID也好,以及SAN和NAS都是借助池化来提升磁盘的利用率。
相关信息
对于多套网络存储系统并存,中国民航计裤纳算机信息中心生产调度部负责人戚前方指出,从企业发灶芹展的角度,SAN的出现就是企业需求的表现。如果纯粹从理论的隐纯毕角度,用一个SAN所构建的网络存储系统支撑企业所有应用系统的存储需求,这是有可能的。
但从实际情况看,这是非常困难的。戚前方指出,很多企业都存在着多套SAN系统并存,不同SAN系统利用率不同,但是又没有办法让多个SAN系统之间形成资源联动。戚前方表示,作为用户他非常需要能够灵活调配存储资源的解决方案。
10. 什么是池化
池化在分布式软件定义存亩轿储常常可见,存储资源池共享,弹性,按需求、按功能分配。最大化利用资源,避免浪费。更多相关的可以通过查询SDS了解,或者通过国内几家做SDS的公司官网大致了解一下,比如迅首肆元芹含核云。