如何降低存储复杂性
A. 企业怎么才能够降低存储成本
从四个方面企业如何节省存储成本:
1.企业存储初期设计要想好。
企业往往很在意企业存储的初期成本,而忽略企业存储的长期投资。在现实生活中,一些厂商往往过多在意初期建设的成本,而忽略了公司存储设备的整体规划,往往是为了省钱,而将存储初期设计的没有规矩,这样在企业后期的升级过程中,往往可能会面临资金的成倍增长,往往造成前期投资的浪费。
还有一些存储厂商,为了吸引客户,往往以低价诱惑企业,虽然企业在前期节省了一些投资,但是在后期升级过程中,却要面临存储提供商的更多的敲诈,得不偿失。
2.利用IT实施三原则。
虚拟化、预留空间和动态分层往往是实施存储的技术建议,这三种方式对于绝大多数的企业来说,能够有利于降低企业的成本。
云存储
云存储对于中小企业来说是一个非常不错的存储地方,包括数据备份、归档等等,都是非常不错的选择。但云存储尚处在发展阶段,尤其是在我国,公有云发展更是举步维艰,私有云倒是因为其独特的优势成为很多企业选择的存储方式。
4.改变企业文化。
在西方的一些国家,一个项目得到批准,不是自己进行建设,而是雇佣一个项目组来进行组件,购买服务器、存储和其它IT设备,项目完成后离开,但是依然负责维护工作,而且不需要付费。
这种一次性支付的方式能够持续多年,不需要支付日常的维护费用,公司应该接受这种消费模式,从长远来看,他们是降低成本的,而且增强了系统的运行稳定性与安全性。
总结:
大数据时代,让企业存储面临更多的挑战,如何恰如其分的部署好存储设施,将是每个企业的挑战,当我们进行存储部署的时候,不妨多想一想,扩展下思路,尽量避免因为我们的决策失误而造成公司资金的浪费。
B. 大数据时代:如何节省存储成本
现今的科技发展日新月异。尤其是存储方面,表现的极其突出。从技术、用户和应用方面来看,其发展速度超越了其他IT领域。同时也带来了相应的问题。数据中心和企业的管理者们都面临着如何选择存储阵列的困惑。通常的解决方案早已被大肆宣传开来,例如像闪存存储或诸如WAN优化等这些被炒作已久的技术似乎已在人们脑海中变得根深蒂固。下面的七个存储解决方案的建议不是基于任何技术的“新生事物”,而只是更具实用性并让企业的花费更具价值。这七个建议应使管理者考虑从新制定他们在2012年的存储预算。根据现有的存储基础设施、资源、数据的特点和所需的访问重新审视市场上存储的关键点,当今正是非常恰当的时机。而存储的关键就在于在提高存储性能的同时减少或至少维持经营成本和资本的支出。1.精简配置在3Par被惠普收购之前。自动精简配置技术在配置存储容量方面起着极其重要的作用。在SAN的初期,企业实际花费更大的力气来保证预期的数据增长。精简资源调配可帮助企业有能力提供他们所需要的,同时保证增加需要的容量而无需创建新的LUNs(logical unit numbers)。2.面向对象存储和REST(Representational State Transfer)最初,这项技术似乎对云计算有更大的影响。现在越来越多的企业认为数据更适合存储在公共云之上。同时HTTP将有可能成为一种传输的手段,利用REST方法来移动和存储数据,并提供丰富的元数据和相关的数据说明。当你看到这种跨广域网案例在数据中心扎根时请不要惊讶。3.广域网优化企业可通过广域网优化产品来提升网络的效率,如广域数据服务商Riverbed。这样做可有效减少通过广域网发送、删除重复数据和压缩数据的通信量。并可显着节省存储空间、降低延迟、降低企业广域网带宽相关费用等好处。通过广域网的优化企业可在世界各地查看和创建数据,就像在局域网内部一样。4.分层存储随着企业需求的成本平衡以及性能需求,将需要存储的数据放在最好的媒介上以匹配数据的价值和性能是非常必要的。对于一些不需要频繁访问的数据不一定存储在SSD或更高性能的磁盘驱动器上。现今供应商提供的存储产品具备根据访问模式自动布局数据的功能。企业应该了解数据存放在介质上形式以及数据模型的增长,以便在作出购买决定之前更好的了解扩展容量和性能的成本。5.向外扩展的NAS传统规模的NAS模型在中小型企业中所占的市场份额越来越小。它正被向外扩展的方式所替代。并开始逐步添加企业在集群方式下提高容量和性能的能力。同时构建一个全局命名空间,并在其中工作。这样可有效简化存储配置,还可大幅降低总成本。6.性能层的设备设备较少的关注基于NAS管理容量的能力。设备更多的关注存储的数据如何以最高的效率移动数据。NAS的优化是使IOPS返回到NAS之中,设备可以不承担所有繁重计算,这些任务全都由NAS负责。其带来的结果是提高性能并减少资本和运营开支。7.FCoEFCoE(以太网光纤通道)可帮助企业在以太网基础设备中扩展光纤通道。这可有效节省基础设施的开销。包括电缆和电源管理方面。而现今大多数人还不太了解FCoE。而且也没有iSCSI和FCoE竞争的消息。但是这并不意味着FCoE不会成为未来的重要技术。基于文件的存储的增长率已超过了数据块的存储。所以光纤通道和FCoE将会存在下去。做出新的选择并不会为你的当前的基础结构或数据中心带来风险。
C. 怎样突破磁盘的限制
那么什么是存储虚拟化呢?不同的公司和企业有不同的定义。虽然虚拟化并不是一个全新的概念,但是在被引入到存储领域后却发生了某些变化,被赋予了新的内涵。
存储虚拟化是通过存储虚拟化的技术方法,将系统中各种异构的存储设备映射为一个单一的存储资源,对用户完全透明,达到互操作性的目的。
通过虚拟化技术,用户可以利用已有的硬件资源,把SAN内部的各种异构的存储资源统一成对用户来说是单一视图的存储资源(Storage Pool),而且采用Striping、LUN Masking、Zoning等技术,用户可以根据自己的需求对这个大的存储池进行方便的分割、分配,保护了用户的已有投资,减少了总体拥有成本(TCO)。另外也可以根据业务的需要,实现存储池对服务器的动态而透明的增长与缩减,更进一步,可以实现SAN与SAN之间的虚拟化、全球的虚拟化。
虚拟化存储的能量正在释放
存储技术经历了从单个的磁盘、磁带、RAID到存储网络系统的发展历程。传统的直接存储(DAS)方式是存储设备附属于某个服务器,数据被局限在某个主机的控制之下,这种方式已远远不能满足企业分布式业务的需要,因而发展出网络存储技术。典型的网络存储技术有网络附加存储(NAS,Network Attached Storage)和存储区域网(SAN,Storage Area Networks)两种。
NAS技术是网络技术在存储领域的延伸和发展。它直接将存储设备挂在网上,具有良好的共享性、开放性;但缺点是与LAN共用同一物理网络,易形成拥塞而影响性能,特别在数据备份时性能较低,影响了它在企业级存储应用中的地位。
SAN技术的存储设备是用专用网络相连的,目前这个网络是基于光纤通道协议。由于光纤通道的存储网和LAN分开,性能得到很大提高。在SAN中,系统扩展、数据迁移、数据本地备份、远程容灾数据备份和数据管理等都比较方便,整个SAN成为一个统一管理的存储池(Storage Pool)。由于具有这些优异的性能,SAN已经成为网络存储的主流,正在引发存储技术与使用的革命性变化。
从技术上说,存储网络(包括NAS和SAN)都是一种很大的技术革新,但是它们都有很多不尽如人意的地方,虽然目前已经实现了一定的存储整合和自动化的存储管理操作,但并没有实现真正的透明存储,存储管理用户仍然需要分别掌握不同存储设备的物理特性,才能对存储池进行有效的管理。
只有采用了存储虚拟化的技术,才能真正屏蔽具体存储设备的物理细节,为用户提供统一集中的存储管理。采用存储虚拟化技术,用户可以实现:
1.存储管理的自动化与智能化
以前没有采用虚拟化的传统存储系统,存储管理和维护工作大部分由人工完成。但是由于企业数据越来越多,存储系统的构成越来越复杂,当增加新的存储设备时,整个系统(包括网络中的诸多用户设备)都需要重新进行烦琐的配置工作。重新配置需要关机、重启动系统、重新初始化等,势必会影响客户业务的正常运行,甚至导致用户数据的不可用。
在虚拟存储环境下,所有的存储资源在逻辑上被映射为一个整体,对用户来说是单一视图的透明存储,而单个存储设备的容量、速度等物理特性却被屏蔽掉了。无论后台的物理存储是什么设备,服务器及其应用系统看到的都是客户非常熟悉的存储设备的逻辑映像。系统管理员不必关心自己的后台存储,只须专注于管理存储空间本身,所有的存储管理操作,如系统升级、改变RAID级别、初始化逻辑卷、建立和分配虚拟磁盘、存储空间扩容等比从前的任何存储技术都更容易,存储管理变得轻松无比。与现有的SAN相比,存储管理的复杂性大大降低了。
2.提高存储效率
能更有效地使用存储。主要表现在消除被束缚的容量、整体使用率达到更高的水平。当前困扰企业用户的最大问题就是物理存储设备的使用效率非常低。以传统磁盘存储为例,考虑到用户数据的不断增长,实际上平均40%~50%的磁盘容量从未被利用过。但同时为满足系统性能和以后升级扩容等方面的要求,客户一般购买超过实际数据量需求3~4倍的磁盘,用于磁盘镜像等附加功能,从而造成了存储空间资源的极大浪费。
虚拟化存储技术解决了这种存储空间使用上的浪费,它把系统中各个分散的存储空间整合起来,形成一个连续编址的逻辑存储空间,突破了单个物理磁盘的容量限制,客户几乎可以100%地使用磁盘容量,而且由于存储池扩展时能自动重新分配数据和利用高效的快照技术降低容量需求,从而极大地提高了存储资源的利用率。
3. 减少总体拥有成本(TCO),增加投资回报(ROI)
由于历史的原因,许多企业不得不面对各种各样的异构环境,包括不同操作平台的服务器和不同厂商不同型号的存储设备。采用存储虚拟化技术,可以支持物理磁盘空间动态扩展,这样用户现有的设备不必抛弃,可以融入到系统中来,保障了用户的已有投资;从而降低了用户TCO,实现了存储容量的动态扩展,增加了用户的ROI。
存储虚拟化能够将存储管理的级别从普通的手工操作水平提升到自动化与智能化的管理水平,减轻应用程序服务器对本地物理存储设备的管理工作,将各种异构的存储系统整合成为能够作为单一资源易于管理的单一存储池;同时,根据不同用户、不同应用的需要,可以配置和实现基于用户定制的数据应用和系统管理。因此,存储虚拟化是企业应用系统新的挑战与机遇的产物,应用前景广阔。
D. 如何用PHOTOSHOP降低图片的存储空间,而尽量保持图片质量
文件另存为TIF格式,选项出来的时候选择LZW压缩。这样图片就会压缩进的比较小,而且图层信息不会丢失。最重要的是TIF格式的图像质量是最好的。
E. 如何节省数据库磁盘储存空间
这个是经典问题了
是采用int型(自增量或手动增量),还是GUID还是联合主键(combo)
考虑这些问题无非从高效性和易用性上进行考虑。下面列出四种主键生成方式优缺点的比较:
自动增长字段
优点1. 使用简单
缺点1. 不同数据库获取当前值方式不同;
2. 难以应用在多个数据库间进行数据迁移的情况。
3.不能集群化
手动增长型字段
优点1.可以获得最新键值
2. 可以确保数据合并过程中不会出现键值冲突
缺点1.通常情况下需要建立一张单独的表存储当前主键键值;
2.增加一次数据库访问来获取当前主键键值;
3. 考虑并发冲突等,增加系统的复杂程度。
4. 不能集群化
使用GUID
优点 1. 直接生成GUID,获得最新键值以填充主键,使用方便;
2.可以确保数据合并过程中不会出现键值冲突;
3. 避免了前两种方式获取当前键值所增加的开销。
缺点1.占用较多存储空间;
2.索引耗时;
3. 在多表链接查询时效率不如int型
使用“COMB”类型
优点1. 保留GUID的已有优点;
2. 利用时间信息与GUID组合起来,增加有序性以提高索引效率。
缺点1.需要设计COMB的生成算法;
2. 和GUID一样占用较多存储空间;
3. 在多表链接查询时效率不如int型,但优于GUID。
从上表的对比中可以看出,问题的焦点还是在是采用高效的,但可控性、可移植性差的整形,还是采用能使用GUID这样可控性和移植性高,但是效率低,存储大的字符型主键,真有点鱼和熊掌不能兼得的味道。(COMB需要设计生成算法,增加程序的复杂度,如果算法不当,会产生意想不到的结果,GUID也可以通过优化索引的方式提升性能,暂不使用COMB)
从数据库的角度来看,整形虽然查询的效率最高,但是数据的合并、移植存在着很大的问题,同时高并发的情况下,各种整形的生成方式都面临这问题,而且不利于集群化处理。而采用GUID生成方式的字符型,能很好解决集成和并发性的问题,但占用空间大,查询效率低可能成为系统运行后将出现的问题。
从程序开发的角度上看,整形生成方式的生成主键非常方便,但是主键的获取,需要整个事务结束,才能从数据库中取到,同时在多关联表保存的时候,需要先保存主表,将产生的主键传给字表,从而也可以造成性能的缺失,并且无法直接获取主键,会增加程序开发处理的复杂性。而字符型的主键,需要程序人员自定义主键生成规则,需要认为的干预主键的生成,但是主键可以在插入数据库之前就能拿到,方便程序的处理。
从系统数据的角度来看,业务数据可能存在大量的并发,采用GUID的方式是非常方便的,在数据级别很大的情况下,可以方便的进行集群化处理。档案型数据并发量小,但是被引用的多,数据合并和集成的情况也很多,完全使用整形是不合适的,完全采用GUID,又会引起性能的缺失,需要更加折中的方案,既保证使用可控性较强的能唯一标识的字符串,同时又要尽量降低字符串占得字节数。而对于系统辅助数据,根据实际情况灵活使用,不做硬性统一,在数据量较小的情况下,尽量采用整形。
F. 谁能帮我降低这个程序的空间复杂度
算法的复杂性
算法的复杂性是算法效率的度量,是评价算法优劣的重要依据。一个算法的复杂性的高低体现在运行该算法所需要的计算机资源的多少上面,所需的资源越多,我们就说该算法的复杂性越高;反之,所需的资源越低,则该算法的复杂性越低。
计算机的资源,最重要的是时间和空间(即存储器)资源。因而,算法的复杂性有时间复杂性和空间复杂性之分。
不言而喻,对于任意给定的问题,设计出复杂性尽可能低的算法是我们在设计算法时追求的一个重要目标;另一方面,当给定的问题已有多种算法时,选择其中复杂性最低者,是我们在选用算法适应遵循的一个重要准则。因此,算法的复杂性分析对算法的设计或选用有着重要的指导意义和实用价值。
简言之,在算法学习过程中,我们必须首先学会对算法的分析,以确定或判断算法的优劣。
1.时间复杂性:
例1:设一程序段如下(为讨论方便,每行前加一行号)
(1) for i:=1 to n do
(2) for j:=1 to n do
(3) x:=x+1
......
试问在程序运行中各步执行的次数各为多少?
解答:
行号 次数(频度)
(1) n+1
(2) n*(n+1)
(3) n*n
可见,这段程序总的执行次数是:f(n)=2n2+2n+1。在这里,n可以表示问题的规模,当n趋向无穷大时,如果 f(n)的值很小,则算法优。作为初学者,我们可以用f(n)的数量级O来粗略地判断算法的时间复杂性,如上例中的时间复杂性可粗略地表示为T(n)=O(n2)。
2.空间复杂性:
例2:将一一维数组的数据(n个)逆序存放到原数组中,下面是实现该问题的两种算法:
算法1:for i:=1 to n do
b[i]:=a[n-i+1];
for i:=1 to n do
a[i]:=b[i];
算法2:for i:=1 to n div 2 do
begin
t:=a[i];a[i]:=a[n-i-1];a[n-i-1]:=t
end;
算法1的时间复杂度为2n,空间复杂度为2n
算法2的时间复杂度为3*n/2,空间复杂度为n+1
显然算法2比算法1优,这两种算法的空间复杂度可粗略地表示为S(n)=O(n)
信息学比赛中,经常是:只要不超过内存,尽可能用空间换时间。
G. 存储虚拟化的问题
据统计,存储数据量的年增长率达50%~60%。面对新的应用,以及不断增加的存储容量,企业用户需要借用虚拟技术来降低管理的复杂性,提高效率。但是随着存储技术的发展,用户对于数据的需求增加,为什么虚拟存储技术没有完全普及呢?这还要从虚拟存储技术面临的困难说起。
目前,企业用户面临的最大压力是什么?一是存储数据的成本在不断地增加;二是数据存储容量爆炸性增长;三是越来越复杂的环境使得存储的数据无法管理。周所周知,虚拟化有三种方式实现,基于服务器、基于存储以及基于网络。基于存储的虚拟化手段,目的就是面向用户的应用进行优化。存储虚拟化首先要解决的难题就是异构平台的数据管理问题。存储虚拟化可以把用户不同的存储系统融合成单一的平台,解决数据管理难题,并通过分级存储实现信息的生命周期管理,从而进一步优化应用环境。
虚拟存储技术最受关注的问题是数据安全问题。因为虚拟存储把所有数据都放在了一个系统环境下,这就相当于把鸡蛋都放在一个篮子里,一旦打翻,所有鸡蛋都会损失。所以一旦数据被存放进虚拟存储环境中,就不能被轻易删除。这无疑加大了数据的风险,在安全投资上也要相应加大。
虚拟存储的第二个问题在于忽视了我国庞大的中小企业需求。目前的虚拟存储技术大部分都是专注于高端用户的,这些用户存储系统庞大,不仅设备多,所采用的软件也很复杂,在这种情况下,虚拟存储技术可以带来管理,成本上的诸多优势。但是目前我国中小企业已经成为企业市场的主力军,不针对中小企业用户的需求推广虚拟存储技术,使该技术的发展变得缓慢了。
阻碍存储虚拟化产品的因素还有一个就是价格,这也正是由于专注于高端市场带来的弊端。对于多数的中小企业用户面临存储空间不足,直接买大容量硬盘来解决存储上的问题,即使在存储空间上有所浪费,但相比使用虚拟化存储架构,大容量的硬盘还是比较合算,此外中小企业存储系统不复杂,管理起来也没有太大难度,这些都导致虚拟存储技术在普及上存在着一定的困难。
一款存储虚拟化产品只能对有限的存储空间起作用。扩展性和性能哪个更为重要,要根据实际的情况来分析。在部署产品之前要进行系统测试。在刚部署完成的初期,扩展性问题也许不会显现出来。因此提前对扩展性进行评估可以帮助用户选择正确的产品。
基于阵列的存储虚拟化产品只是对自己厂家的产品有效。基于主机或者光纤的存储虚拟化产品也是对某些特定厂家的软件或者设备有效。用户需要检查存储虚拟化产品是否跟自己当前的存储环境兼容。
综上所述,虚拟存储技术不仅在存储厂商是热门话题,而且在用户中对于存储虚拟化技术呼声越来越高,随着人们对于数据安全性、完整性的要求提高,存储系统已经成为IT应用中的重要环节,存储系统的复杂化,存储系统的管理也成为难点,相信在不久的将来虚拟存储技术在克服了面临的困难后,会给企业用户存储系统的效率的提高,系统安全稳定的运行,减少总体拥有成本,增加投资回报等方面有效的实现。
H. 如何节省存储空间
1、首先,打开【设置】,进入设置界面,找到最上方的【Apple ID、icloud】选项,如图所示,然后在下一个界面选择【iCloud】。