sqlserver优化
‘壹’ sql Server鏁版嵁搴撶殑楂樻ц兘浼桦寲缁忛獙镐荤粨
链鏂囦富瑕佸悜澶у朵粙缁岖殑鏄姝g‘浼桦寲SQL
Server鏁版嵁搴撶殑缁忛獙镐荤粨锛屽叾涓鍖呮嫭鍦ㄥ瑰叾杩涜屼紭鍖栫殑瀹为檯镎崭綔涓鍊煎缑澶у舵敞镒忕殑鍦版柟鎻忚堪锛屼互鍙婂笋QL璇鍙ヨ繘琛屼紭鍖栫殑链锘烘湰铡熷垯锛屼互涓嫔氨鏄鏂囩珷镄勪富瑕佸唴瀹规弿杩般
銆銆浼桦寲鏁版嵁搴撶殑娉ㄦ剰浜嬮”锛
銆銆1銆佸叧阌瀛楁靛缓绔嬬储寮曘
銆銆2銆佷娇鐢ㄥ瓨鍌ㄨ繃绋嬶纴瀹冧娇SQL鍙桦缑镟村姞𨱔垫椿鍜岄珮鏁堛
銆銆3銆佸囦唤鏁版嵁搴揿拰娓呴櫎鍨冨溇鏁版嵁銆
銆銆4銆丼QL璇鍙ヨ娉旷殑浼桦寲銆(鍙浠ョ敤Sybase镄凷QL
Expert锛屽彲𨱍沧垜娌℃垒鍒皍nexpired镄勫簭鍒楀彿)
銆銆5銆佹竻鐞嗗垹闄ゆ棩蹇椼
銆銆SQL璇鍙ヤ紭鍖栫殑锘烘湰铡熷垯锛
銆銆1銆佷娇鐢ㄧ储寮曟潵镟村揩鍦伴亶铡呜〃銆
銆銆缂虹渷𨱍呭喌涓嫔缓绔嬬殑绱㈠紩鏄闱炵兢闆嗙储寮曪纴浣嗘湁镞跺畠骞朵笉鏄链浣崇殑銆傚湪闱炵兢闆嗙储寮曚笅锛屾暟鎹鍦ㄧ墿鐞嗕笂闅忔満瀛樻斁鍦ㄦ暟鎹椤典笂銆傚悎鐞嗙殑绱㈠紩璁捐¤佸缓绔嫔湪瀵瑰悇绉嶆煡璇㈢殑鍒嗘瀽鍜岄勬祴涓娿
銆銆涓鑸𨱒ヨ达细
銆銆鈶.链夊ぇ閲忛吨澶嶅笺佷笖缁忓父链夎寖锲存煡璇(between,
>,<
锛>=,<
=)鍜宱rder
by銆乬roup
by鍙戠敓镄勫垪锛屽彲钥冭槛寤虹珛缇ら泦绱㈠紩
銆銆鈶.缁忓父钖屾椂瀛桦彇澶氩垪锛屼笖姣忓垪閮藉惈链夐吨澶嶅煎彲钥冭槛寤虹珛缁勫悎绱㈠紩;
銆銆鈶.缁勫悎绱㈠紩瑕佸敖閲忎娇鍏抽敭镆ヨ㈠舰鎴愮储寮曡嗙洊锛屽叾鍓嶅煎垪涓瀹氭槸浣跨敤链棰戠箒镄勫垪銆
銆銆2銆両S
NULL
涓
IS
NOT
NULL
銆銆涓嶈兘鐢╪ull浣灭储寮曪纴浠讳綍鍖呭惈null鍊肩殑鍒楅兘灏嗕笉浼氲鍖呭惈鍦ㄧ储寮曚腑銆傚嵆浣跨储寮曟湁澶氩垪杩欐牱镄勬儏鍐典笅锛屽彧瑕佽繖浜涘垪涓链変竴鍒楀惈链塶ull锛岃ュ垪灏变细浠庣储寮曚腑鎺挜櫎銆备篃灏辨槸璇村傛灉镆愬垪瀛桦湪绌哄硷纴鍗充娇瀵硅ュ垪寤虹储寮曚篃涓崭细鎻愰珮镐ц兘銆备换浣曞湪where瀛愬彞涓浣跨敤is
null鎴杋s
not
null镄勮鍙ヤ紭鍖栧櫒鏄涓嶅厑璁镐娇鐢ㄧ储寮旷殑銆
銆銆3銆両N鍜孍XISTS
銆銆EXISTS瑕佽繙姣擨N镄勬晥鐜囬珮銆傞噷闱㈠叧绯诲埌full
table
scan鍜宺ange
scan銆傚嚑涔庡皢镓链夌殑IN镎崭綔绗﹀瓙镆ヨ㈡敼鍐欎负浣跨敤EXISTS镄勫瓙镆ヨ銆
銆銆4銆佸湪娴烽噺镆ヨ㈡椂灏介噺灏戠敤镙煎纺杞鎹銆
銆銆5銆佸綋鍦⊿QL
SERVER
2000涓
銆銆濡傛灉瀛桦偍杩囩▼鍙链変竴涓鍙傛暟锛屽苟涓旀槸OUTPUT绫诲瀷镄勶纴蹇呴’鍦ㄨ皟鐢ㄨ繖涓瀛桦偍杩囩▼镄勬椂鍊欑粰杩欎釜鍙傛暟涓涓鍒濆嬬殑鍊硷纴钖﹀垯浼氩嚭鐜拌皟鐢ㄩ敊璇銆
銆銆6銆丱RDER
BY鍜孏ROPU
BY
銆銆浣跨敤ORDER
BY鍜孏ROUP
BY鐭璇锛屼换浣曚竴绉岖储寮曢兘链夊姪浜岙ELECT镄勬ц兘鎻愰珮銆傛敞镒忓傛灉绱㈠紩鍒楅噷闱㈡湁NULL鍊硷纴Optimizer灏嗘棤娉曚紭鍖栥
銆銆7銆佷换浣曞瑰垪镄勬搷浣滈兘灏嗗艰嚧琛ㄦ壂鎻忥纴瀹冨寘𨰾琒QL
Server鏁版嵁搴揿嚱鏁般佽$畻琛ㄨ揪寮忕瓑绛夛纴镆ヨ㈡椂瑕佸敖鍙鑳藉皢镎崭綔绉昏呖绛夊彿鍙宠竟銆
銆銆8銆両N銆丱R瀛愬彞甯镐细浣跨敤宸ヤ綔琛锛屼娇绱㈠紩澶辨晥銆傚傛灉涓崭骇鐢熷ぇ閲忛吨澶嶅硷纴鍙浠ヨ冭槛鎶婂瓙鍙ユ媶寮銆傛媶寮镄勫瓙鍙ヤ腑搴旇ュ寘钖绱㈠紩銆
銆銆9銆丼ET
SHOWPLAN_ALL>10銆佽皑鎱庝娇鐢ㄦ父镙
銆銆鍦ㄦ煇浜涘繀椤讳娇鐢ㄦ父镙囩殑鍦哄悎锛屽彲钥冭槛灏嗙﹀悎𨱒′欢镄勬暟鎹琛岃浆鍏ヤ复镞惰〃涓锛屽啀瀵逛复镞惰〃瀹氢箟娓告爣杩涜屾搷浣滐纴杩欐牱鍙浣挎ц兘寰楀埌鏄庢樉鎻愰珮銆
銆銆娉ㄩ喷锛氭墍璋撶殑浼桦寲灏辨槸WHERE瀛愬彞鍒╃敤浜嗙储寮曪纴涓嶅彲浼桦寲鍗冲彂鐢熶简琛ㄦ壂鎻忔垨棰濆栧紑阌銆傜粡楠屾樉绀猴纴SQL
Server鏁版嵁搴撴ц兘镄勬渶澶ф敼杩涘缑鐩娄簬阃昏緫镄勬暟鎹搴撹捐°佺储寮曡捐″拰镆ヨ㈣捐℃柟闱銆傚弽杩囨潵璇达纴链澶х殑镐ц兘闂棰桦父甯告槸鐢卞叾涓杩欎簺鐩稿悓鏂归溃涓镄勪笉瓒冲紩璧风殑銆
銆銆鍏跺疄SQL浼桦寲镄勫疄璐ㄥ氨鏄鍦ㄧ粨鏋沧g‘镄勫墠鎻愪笅锛岀敤浼桦寲鍣ㄥ彲浠ヨ瘑鍒镄勮鍙ワ纴鍏呬唤鍒╃敤绱㈠紩锛屽噺灏戣〃镓鎻忕殑I/O娆℃暟锛屽敖閲忛伩鍏嶈〃鎼灭储镄勫彂鐢熴傚叾瀹濻QL镄勬ц兘浼桦寲鏄涓涓澶嶆潅镄勮繃绋嬶纴涓婅堪杩欎簺鍙鏄鍦ㄥ簲鐢ㄥ眰娆$殑涓绉崭綋鐜帮纴娣卞叆镰旂┒杩树细娑夊强SQL
Server鏁版嵁搴揿眰镄勮祫婧愰厤缃銆佺绣缁滃眰镄勬祦閲忔带鍒朵互鍙婃搷浣灭郴缁熷眰镄勬讳綋璁捐°
‘贰’ win7绯荤粺SQLServer杞浠跺崰鐢ㄥぇ閲忓唴瀛樼┖闂存庝箞锷
缁嗗绩鐢ㄦ埛镓揿紑win7绯荤粺浠诲姟绠$悊鍣锛屽彂鐜癝QLServerCPU鍗犵敤澶ч噺鍐呭瓨绌洪棿锛屽艰嚧鐢佃剳杩愯岄熷害鍙樻参锛屼弗閲嶈缮鍑虹幇鍗℃満鐜拌薄锛屾庝箞锲炰簨锻锛熶竴鑸鏄锲犱负镆ヨ㈡暟鎹閲忓ぇ锛屾墽琛屾椂闂撮暱阃犳垚镄勚傞偅涔堟湁浠涔埚姙娉曡В鍐硍in7绯荤粺SQLServer杞浠跺崰鐢ㄥぇ閲忓唴瀛樼┖闂寸殑闂棰桡纴涓嶈佺潃镐ワ纴鎺ヤ笅铡诲皬缂栧憡璇夊ぇ瀹跺叿浣撹В鍐虫柟娉曘
鎺ㄨ崘锛闆ㄦ滠链ㄩ巜in7镞楄埌鐗堢郴缁熶笅杞
鍏蜂綋鏂规硶濡备笅:
1銆佹墦寮SQLServerProfiler锛
2銆佹柊寤鸿窡韪
a.镣瑰嚮鏂板缓璺熻釜锛屽苟璁剧疆濂芥暟鎹搴撹繛鎺
b.璁剧疆璺熻釜灞炴э纴阃夋嫨妯℃澘钬沦tandard钬
c.鍒囧埌钬滀簨浠堕夋嫨钬濊繘琛岃窡韪璁剧疆
1銆佸彧淇濈暀濡备笅涓や釜浜嬩欢阃夐”
2銆佺偣鍑诲垪绛涢
3銆佽繘琛岃︾粏绛涢夎剧疆
璁剧疆CPU镞堕棿浣滀负绛涢夋浔浠讹纴鍗曚綅姣绉掞纸鐢ㄤ簬璺熻釜钥桟PU鍗犵敤杈冮暱镄勬煡璇锛屽彲璁剧疆涓哄ぇ浜庣瓑浜20000锛屾寜CPU鍐呮牳鏁懊1000锛屽彲浠ヨ窡韪狢PU鍗犵敤100%澶т簬1绉掔殑镆ヨ锛
3銆佺偣鍑昏繍琛岋纴璺熻釜璇鍙ワ纴瀹氢綅CPU鍗犵敤杈冨氱殑璇瑷锛屽备笅锲炬墍绀猴纴CPU鍗犵敤2660146姣绉掞纴CPU涓24镙革纴鍒栾呖灏愠PU鍗犵敤100%钥楁椂2660146/24/1000=110绉掓墠鍙浠ユ墽琛屽ソ鐩稿簲镄勬搷浣滐绂
4銆佹牴鎹璇鍙ョ壒寰侊纴鍦ㄤ綘镄勬湇锷″櫒绋嫔簭涓镓惧埌鐩稿簲镄勫姛鑳斤纴浣滃嚭淇姝o绂
鍒嗘瀽镆ヨ涓闇瑕佹绱㈡暟鎹閲忚缉澶х殑閮ㄥ垎锛屼綔鍑虹亩鍗曚慨姝(濡傛敞阌)
镟存柊钖庨吨鏂版墽琛屾ゆ煡璇锛屾煡鐪媝rofiler涓鏄钖CPU鍗犵敤娑埚け
濡傛灉宸叉秷澶辫存槑闂棰桦畾浣嶆g‘锛屽彲浠ヤ紭鍖栨煡璇锛岃嫢CPU鍗犵敤浠荤劧寰埚氾纴鍒椤洖婊氢慨鏀癸纴缁х画4.1镎崭綔
涓婅堪浠嬬粛鍏充簬win7绯荤粺SQLServer杞浠跺崰鐢ㄥぇ閲忓唴瀛樼┖闂寸殑瑙e喅鏂规硶锛屾湁闇瑕佺殑鐢ㄦ埛鍙浠ュ弬钥冧娇鐢锛屽笇链涙湰鏁欑▼鍙浠ュ府锷╁埌澶у讹紒
‘叁’ 如何利用索引提高SQLServer数据处理的效率
在良好的数据库设计基础上,能有效地使用索引是SQL Server取得高性能的基础,SQL Server采用基于代价的优化模型,它对每一个提交的有关表的查询,决定是否使用索引或用哪一个索引。因为查询执行的大部分开销是磁盘I/O,使用索引提高性能的一个主要目标是避免全表扫描,因为全表扫描需要从磁盘上读表的每一个数据页,如果有索引指向数据值,则查询只需读几次磁盘就可以了。
所以如果建立了合理的索引,优化器就能利用索引加速数据的查询过程。但是,索引并不总是提高系统的性能,在增、删、改操作中索引的存在会增加一定的工作量,因此,在适当的地方增加适当的索引并从不合理的地方删除次优的索引,将有助于优化那些性能较差的SQL Server应用。实践表明,合理的索引设计是建立在对各种查询的分析和预测上的,只有正确地使索引与程序结合起来,才能产生最佳的优化方案。本文就SQL Server索引的性能问题进行了一些分析和实践。
一、聚簇索引(clustered indexes)的使用
聚簇索引是一种对磁盘上实际数据重新组织以按指定的一个或多个列的值排序。由于聚簇索引的索引页面指针指向数据页面,所以使用聚簇索引查找数据几乎总是比使用非聚簇索引快。每张表只能建一个聚簇索引,并且建聚簇索引需要至少相当该表120%的附加空间,以存放该表的副本和索引中间页。建立聚簇索引的思想是:
1、大多数表都应该有聚簇索引或使用分区来降低对表尾页的竞争,在一个高事务的环境中,对最后一页的封锁严重影响系统的吞吐量。
2、在聚簇索引下,数据在物理上按顺序排在数据页上,重复值也排在一起,因而在那些包含范围检查(between、<、<=、>、>=)或使用group by或order by的查询时,一旦找到具有范围中第一个键值的行,具有后续索引值的行保证物理上毗连在一起而不必进一步搜索,避免了大范围扫描,可以大大提高查询速度。
3、在一个频繁发生插入操作的表上建立聚簇索引时,不要建在具有单调上升值的列(如IDENTITY)上,否则会经常引起封锁冲突。
4、在聚簇索引中不要包含经常修改的列,因为码值修改后,数据行必须移动到新的位置。
5、选择聚簇索引应基于where子句和连接操作的类型。
聚簇索引的侯选列是:
1、主键列,该列在where子句中使用并且插入是随机的。
2、按范围存取的列,如pri_order > 100 and pri_order < 200。
3、在group by或order by中使用的列。
4、不经常修改的列。
5、在连接操作中使用的列。
二、非聚簇索引(nonclustered indexes)的使用
SQL Server缺省情况下建立的索引是非聚簇索引,由于非聚簇索引不重新组织表中的数据,而是对每一行存储索引列值并用一个指针指向数据所在的页面。换句话说非聚簇索引具有在索引结构和数据本身之间的一个额外级。一个表如果没有聚簇索引时,可有250个非聚簇索引。每个非聚簇索引提供访问数据的不同排序顺序。在建立非聚簇索引时,要权衡索引对查询速度的加快与降低修改速度之间的利弊。另外,还要考虑这些问题:
1、索引需要使用多少空间。
2、合适的列是否稳定。
3、索引键是如何选择的,扫描效果是否更佳。
4、是否有许多重复值。
对更新频繁的表来说,表上的非聚簇索引比聚簇索引和根本没有索引需要更多的额外开销。对移到新页的每一行而言,指向该数据的每个非聚簇索引的页级行也必须更新,有时可能还需要索引页的分理。从一个页面删除数据的进程也会有类似的开销,另外,删除进程还必须把数据移到页面上部,以保证数据的连续性。所以,建立非聚簇索引要非常慎重。非聚簇索引常被用在以下情况:
1、某列常用于集合函数(如Sum,....)。
2、某列常用于join,order by,group by。
3、查寻出的数据不超过表中数据量的20%。
三、覆盖索引(covering indexes)的使用
覆盖索引是指那些索引项中包含查寻所需要的全部信息的非聚簇索引,这种索引之所以比较快也正是因为索引页中包含了查寻所必须的数据,不需去访问数据页。如果非聚簇索引中包含结果数据,那么它的查询速度将快于聚簇索引。
但是由于覆盖索引的索引项比较多,要占用比较大的空间。而且update操作会引起索引值改变。所以如果潜在的覆盖查询并不常用或不太关键,则覆盖索引的增加反而会降低性能。
四、索引的选择技术
p_detail是住房公积金管理系统中记录个人明细的表,有890000行,观察在不同索引下的查询运行效果,测试在C/S环境下进行,客户机是IBM PII350(内存64M),服务器是DEC Alpha1000A(内存128M),数据库为SYBASE11.0.3。
1、 select count(*) from p_detail where
op_date>’19990101’ and op_date<’
19991231’ and pri_surplus1>300
2、 select count(*),sum(pri_surplus1) from p_detail
where op_date>’19990101’ and
pay_month between‘199908’ and’199912’
不建任何索引查询1 1分15秒
查询2 1分7秒
在op_date上建非聚簇索引查询1 57秒
查询2 57秒
在op_date上建聚簇索引查询1 <1秒
查询2 52秒
在pay_month、op_date、pri_surplus1上建索引查询1 34秒
查询2 <1秒
在op_date、pay_month、pri_surplus1上建索引查询1 <1秒
查询2 <1秒
从以上查询效果分析,索引的有无,建立方式的不同将会导致不同的查询效果,选择什么样的索引基于用户对数据的查询条件,这些条件体现于where从句和join表达式中。一般来说建立索引的思路是:
(1)主键时常作为where子句的条件,应在表的主键列上建立聚簇索引,尤其当经常用它作为连接的时候。
(2)有大量重复值且经常有范围查询和排序、分组发生的列,或者非常频繁地被访问的列,可考虑建立聚簇索引。
(3)经常同时存取多列,且每列都含有重复值可考虑建立复合索引来覆盖一个或一组查询,并把查询引用最频繁的列作为前导列,如果可能尽量使关键查询形成覆盖查询。
(4)如果知道索引键的所有值都是唯一的,那么确保把索引定义成唯一索引。
(5)在一个经常做插入操作的表上建索引时,使用fillfactor(填充因子)来减少页分裂,同时提高并发度降低死锁的发生。如果在只读表上建索引,则可以把fillfactor置为100。
(6)在选择索引键时,设法选择那些采用小数据类型的列作为键以使每个索引页能够容纳尽可能多的索引键和指针,通过这种方式,可使一个查询必须遍历的索引页面降到最小。此外,尽可能地使用整数为键值,因为它能够提供比任何数据类型都快的访问速度。
五、索引的维护
上面讲到,某些不合适的索引影响到SQL Server的性能,随着应用系统的运行,数据不断地发生变化,当数据变化达到某一个程度时将会影响到索引的使用。这时需要用户自己来维护索引。索引的维护包括:
1、重建索引
随着数据行的插入、删除和数据页的分裂,有些索引页可能只包含几页数据,另外应用在执行大块I/O的时候,重建非聚簇索引可以降低分片,维护大块I/O的效率。重建索引实际上是重新组织B-树空间。在下面情况下需要重建索引:
(1)数据和使用模式大幅度变化。
(2)排序的顺序发生改变。
(3)要进行大量插入操作或已经完成。
(4)使用大块I/O的查询的磁盘读次数比预料的要多。
(5)由于大量数据修改,使得数据页和索引页没有充分使用而导致空间的使用超出估算。
(6)dbcc检查出索引有问题。
当重建聚簇索引时,这张表的所有非聚簇索引将被重建。
2、索引统计信息的更新
当在一个包含数据的表上创建索引的时候,SQL Server会创建分布数据页来存放有关索引的两种统计信息:分布表和密度表。优化器利用这个页来判断该索引对某个特定查询是否有用。但这个统计信息并不动态地重新计算。这意味着,当表的数据改变之后,统计信息有可能是过时的,从而影响优化器追求最有工作的目标。因此,在下面情况下应该运行update statistics命令:
(1)数据行的插入和删除修改了数据的分布。
(2)对用truncate table删除数据的表上增加数据行。
(3)修改索引列的值。
六、结束语
实践表明,不恰当的索引不但于事无补,反而会降低系统的执行性能。因为大量的索引在插入、修改和删除操作时比没有索引花费更多的系统时间。例如下面情况下建立的索引是不恰当的:
1、在查询中很少或从不引用的列不会受益于索引,因为索引很少或从来不必搜索基于这些列的行。
2、只有两个或三个值的列,如男性和女性(是或否),从不会从索引中得到好处。
另外,鉴于索引加快了查询速度,但减慢了数据更新速度的特点。可通过在一个段上建表,而在另一个段上建其非聚簇索引,而这两段分别在单独的物理设备上来改善操作性能。
‘肆’ 怎样进行sql数据库的优化
1、数据库空间是个概述,在sqlserver里,使用语句 exec sp_spaceused 'TableName' 这个语句来查。