1. 首页
  2. IT资讯

大数据量环境下的SQL优化

“u003Cdivu003Eu003Cpu003E在WEB开发中我们写的最多的就是数据库相关的操作,而数据库操作最关键的就是SQL语句的编写。而我们现阶段遇到的数据库操作都是数据量很小的,并发量不高的情况,如果在高并发下,数据量非常大的情况下,SQL的执行效率就可能非常低,严重的可能导致服务器拥堵、甚至崩溃。所以SQL语句的优化就至关重要了。下面我们讨论一下SQL语句编写的时候需要注意的一些细节。u003Cu002Fpu003Eu003Cpu003E 1.对查询进行优化,要尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引。u003Cu002Fpu003Eu003Cpu003E 2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全表扫描,如:u003Cu002Fpu003Eu003Cblockquoteu003Eu003Cpu003Eu003Cstrongu003Eselectu003Cu002Fstrongu003E id u003Cstrongu003Efromu003Cu002Fstrongu003E t u003Cstrongu003Ewhereu003Cu002Fstrongu003E num u003Cstrongu003Eisu003Cu002Fstrongu003E nullu003Cu002Fpu003Eu003Cu002Fblockquoteu003Eu003Cpu003E 最好不要给数据库留NULL,尽可能的使用 NOT NULL填充数据库。备注、描述、评论之类的可以设置为 NULL,其他的,最好不要使用NULL。不要以为 NULL 不需要空间,比如:char(100) 型,在字段建立时,空间就固定了, 不管是否插入值(NULL也包含在内),都是占用 100个字符的空间的,如果是varchar这样的变长字段, null 不占用空间。可以在数值字段上设置默认值0,确保表中的列没有null值,然后这样查询:u003Cu002Fpu003Eu003Cblockquoteu003Eu003Cpu003Eu003Cstrongu003Eselectu003Cu002Fstrongu003E id u003Cstrongu003Efromu003Cu002Fstrongu003E t u003Cstrongu003Ewhereu003Cu002Fstrongu003E num = 0u003Cu002Fpu003Eu003Cu002Fblockquoteu003Eu003Cpu003E 空字段不仅占用空间,而且NULL值在做数值运算的时候也会出现一些问题,例如NULL加上任何值都是NULL,会导致数据错误。u003Cu002Fpu003Eu003Cpu003E 3.应尽量避免在 where 子句中使用 != 或 <> 操作符,否则将引擎放弃使用索引而进行全表扫描。u003Cu002Fpu003Eu003Cpu003E 4.应尽量避免在 where 子句中使用 or 来连接条件,如果一个字段有索引,一个字段没有索引,将导致引擎放弃使用索引而进行全表扫描,如:u003Cu002Fpu003Eu003Cblockquoteu003Eu003Cpu003Eu003Cstrongu003Eselectu003Cu002Fstrongu003E id u003Cstrongu003Efromu003Cu002Fstrongu003E t u003Cstrongu003Ewhereu003Cu002Fstrongu003E num=10 or u003Cstrongu003Enameu003Cu002Fstrongu003E = ‘admin’u003Cu002Fpu003Eu003Cu002Fblockquoteu003Eu003Cpu003E 假如在num字段加了索引而name字段没有加索引,就会导致这条select语句执行的时候不使用索引,可以换成下面的写法:u003Cu002Fpu003Eu003Cblockquoteu003Eu003Cpu003Eu003Cstrongu003Eselectu003Cu002Fstrongu003E id u003Cstrongu003Efromu003Cu002Fstrongu003E t u003Cstrongu003Ewhereu003Cu002Fstrongu003E num = 10u003Cu002Fpu003Eu003Cpu003Eu003Cstrongu003Eunionu003Cu002Fstrongu003E allu003Cu002Fpu003Eu003Cpu003Eu003Cstrongu003Eselectu003Cu002Fstrongu003E id u003Cstrongu003Efromu003Cu002Fstrongu003E t u003Cstrongu003Ewhereu003Cu002Fstrongu003E u003Cstrongu003ENameu003Cu002Fstrongu003E = ‘admin’u003Cu002Fpu003Eu003Cu002Fblockquoteu003Eu003Cpu003E 结果是一样的,但是有一条语句是使用索引的,效率就会提升。u003Cu002Fpu003Eu003Cpu003E 5.in 和 not in 也要慎用,否则会导致全表扫描,如:u003Cu002Fpu003Eu003Cblockquoteu003Eu003Cpu003Eu003Cstrongu003Eselectu003Cu002Fstrongu003E id u003Cstrongu003Efromu003Cu002Fstrongu003E t u003Cstrongu003Ewhereu003Cu002Fstrongu003E num in(1,2,3)u003Cu002Fpu003Eu003Cu002Fblockquoteu003Eu003Cpu003E 对于连续的数值,能用 between 就不要用 in 了:u003Cu002Fpu003Eu003Cblockquoteu003Eu003Cpu003Eu003Cstrongu003Eselectu003Cu002Fstrongu003E id u003Cstrongu003Efromu003Cu002Fstrongu003E t u003Cstrongu003Ewhereu003Cu002Fstrongu003E num between 1 and 3u003Cu002Fpu003Eu003Cu002Fblockquoteu003Eu003Cpu003E 很多时候用 exists 代替 in 是一个好的选择,例如下面的语句:u003Cu002Fpu003Eu003Cblockquoteu003Eu003Cpu003Eu003Cstrongu003Eselectu003Cu002Fstrongu003E num u003Cstrongu003Efromu003Cu002Fstrongu003E a u003Cstrongu003Ewhereu003Cu002Fstrongu003E num in(u003Cstrongu003Eselectu003Cu002Fstrongu003E num u003Cstrongu003Efromu003Cu002Fstrongu003E b)u003Cu002Fpu003Eu003Cu002Fblockquoteu003Eu003Cpu003E 用下面的语句替换:u003Cu002Fpu003Eu003Cblockquoteu003Eu003Cpu003Eu003Cstrongu003Eselectu003Cu002Fstrongu003E num u003Cstrongu003Efromu003Cu002Fstrongu003E a u003Cstrongu003Ewhereu003Cu002Fstrongu003E exists(u003Cstrongu003Eselectu003Cu002Fstrongu003E 1 u003Cstrongu003Efromu003Cu002Fstrongu003E b u003Cstrongu003Ewhereu003Cu002Fstrongu003E num=a.num)u003Cu002Fpu003Eu003Cu002Fblockquoteu003Eu003Cpu003E 6.模糊查询也将导致全表扫描,所以想用like的时候要慎重。u003Cu002Fpu003Eu003Cpu003E 7.如果在 where 子句中使用参数,也会导致全表扫描。因为SQL只有在运行时才会解析局部变量,但优化程序不能将访问计划的选择推迟到运行时;它必须在编译时进行选择。然而,如果在编译时建立访问计划,变量的值还是未知的,因而无法作为索引选择的输入项。如下面语句将进行全表扫描:u003Cu002Fpu003Eu003Cblockquoteu003Eu003Cpu003Eu003Cstrongu003Eselectu003Cu002Fstrongu003E id u003Cstrongu003Efromu003Cu002Fstrongu003E t u003Cstrongu003Ewhereu003Cu002Fstrongu003E num = @numu003Cu002Fpu003Eu003Cu002Fblockquoteu003Eu003Cpu003E 可以改为强制查询使用索引:u003Cu002Fpu003Eu003Cblockquoteu003Eu003Cpu003Eu003Cstrongu003Eselectu003Cu002Fstrongu003E id u003Cstrongu003Efromu003Cu002Fstrongu003E t u003Cstrongu003Ewithu003Cu002Fstrongu003E(u003Cstrongu003Eindexu003Cu002Fstrongu003E(索引名)) u003Cstrongu003Ewhereu003Cu002Fstrongu003E num = @numu003Cu002Fpu003Eu003Cu002Fblockquoteu003Eu003Cpu003E 8.应尽量避免在 where 子句中对字段进行表达式操作,这将导致引擎放弃使用索引而进行全表扫描。如:u003Cu002Fpu003Eu003Cblockquoteu003Eu003Cpu003Eu003Cstrongu003Eselectu003Cu002Fstrongu003E id u003Cstrongu003Efromu003Cu002Fstrongu003E t u003Cstrongu003Ewhereu003Cu002Fstrongu003E numu002F2 = 100u003Cu002Fpu003Eu003Cu002Fblockquoteu003Eu003Cpu003E 应改为:u003Cu002Fpu003Eu003Cblockquoteu003Eu003Cpu003Eu003Cstrongu003Eselectu003Cu002Fstrongu003E id u003Cstrongu003Efromu003Cu002Fstrongu003E t u003Cstrongu003Ewhereu003Cu002Fstrongu003E num = 100*2u003Cu002Fpu003Eu003Cu002Fblockquoteu003Eu003Cpu003E 9.应尽量避免在where子句中对字段进行函数操作,这将导致引擎放弃使用索引而进行全表扫描。如:u003Cu002Fpu003Eu003Cblockquoteu003Eu003Cpu003Eu003Cstrongu003Eselectu003Cu002Fstrongu003E id u003Cstrongu003Efromu003Cu002Fstrongu003E t u003Cstrongu003Ewhereu003Cu002Fstrongu003E substring(u003Cstrongu003Enameu003Cu002Fstrongu003E,1,3) = ’abc’ -–u003Cstrongu003Enameu003Cu002Fstrongu003E以abc开头的idu003Cu002Fpu003Eu003Cpu003Eu003Cstrongu003Eselectu003Cu002Fstrongu003E id u003Cstrongu003Efromu003Cu002Fstrongu003E t u003Cstrongu003Ewhereu003Cu002Fstrongu003E datediff(day,createdate,’2005-11-30′) = 0 -–‘2005-11-30’ –生成的idu003Cu002Fpu003Eu003Cu002Fblockquoteu003Eu003Cpu003E应改为:u003Cu002Fpu003Eu003Cblockquoteu003Eu003Cpu003Eu003Cstrongu003Eselectu003Cu002Fstrongu003E id u003Cstrongu003Efromu003Cu002Fstrongu003E t u003Cstrongu003Ewhereu003Cu002Fstrongu003E u003Cstrongu003Enameu003Cu002Fstrongu003E like ‘abc%’u003Cu002Fpu003Eu003Cpu003Eu003Cstrongu003Eselectu003Cu002Fstrongu003E id u003Cstrongu003Efromu003Cu002Fstrongu003E t u003Cstrongu003Ewhereu003Cu002Fstrongu003E createdate >= ‘2005-11-30’ and createdate < ‘2005-12-1’u003Cu002Fpu003Eu003Cu002Fblockquoteu003Eu003Cpu003E 10.不要在 where 子句中的“=”左边进行函数、算术运算或其他表达式运算,否则系统将可能无法正确使用索引。u003Cu002Fpu003Eu003Cpu003E 11.在使用索引字段作为条件时,如果该索引是复合索引,那么必须使用到该索引中的第一个字段作为条件时才能保证系统使用该索引,否则该索引将不会被使用,并且应尽可能的让字段顺序与索引顺序相一致。u003Cu002Fpu003Eu003Cpu003E 12.Update 语句,如果只更改1、2个字段,不要Update全部字段,否则频繁调用会引起明显的性能消耗,同时带来大量日志。u003Cu002Fpu003Eu003Cpu003E 13.对于多张大数据量(这里几百条就算大了)的表JOIN,要先分页再JOIN,否则逻辑读会很高,性能很差。u003Cu002Fpu003Eu003Cpu003E 14.select count(*) from table;这样不带任何条件的count会引起全表扫描,并且没有任何业务意义,是一定要杜绝的。u003Cu002Fpu003Eu003Cpu003E 15.索引并不是越多越好,索引固然可以提高相应的 select 的效率,但同时也降低了 insert 及 update 的效率,因为 insert 或 update 时有可能会重建索引,所以怎样建索引需要慎重考虑,视具体情况而定。一个表的索引数最好不要超过6个,若太多则应考虑一些不常使用到的列上建的索引是否有 必要。u003Cu002Fpu003Eu003Cpu003E 16.尽量使用数字型字段,若只含数值信息的字段尽量不要设计为字符型,这会降低查询和连接的性能,并会增加存储开销。这是因为引擎在处理查询和连接时会逐个比较字符串中每一个字符,而对于数字型而言只需要比较一次就够了。u003Cu002Fpu003Eu003Cpu003E 17.尽可能的使用 varcharu002Fnvarchar 代替 charu002Fnchar ,因为首先变长字段存储空间小,可以节省存储空间,其次对于查询来说,在一个相对较小的字段内搜索效率显然要高些。u003Cu002Fpu003Eu003Cpu003E 18.任何地方都不要使用 select * from t ,用具体的字段列表代替“*”,不要返回用不到的任何字段。u003Cu002Fpu003Eu003Cpu003E 19.在新建临时表时,如果一次性插入数据量很大,那么可以使用 select into 代替 create table,避免造成大量 log ,以提高速度;如果数据量不大,为了缓和系统表的资源,应先create table,然后insert。u003Cu002Fpu003Eu003Cpu003E 20.尽量避免使用游标,因为游标的效率较差,如果游标操作的数据超过1万行,那么就应该考虑改写。u003Cu002Fpu003Eu003Cpu003E 21.尽量避免大事务操作,提高系统并发能力。u003Cu002Fpu003Eu003Cpu003E 22.尽量避免向客户端返回大数据量,若数据量过大,应该考虑相应需求是否合理。u003Cu002Fpu003Eu003Cpu003E 如果你需要在一个在线的网站上去执行一个大的 DELETE 或 INSERT 查询,你需要非常小心,要避免你的操作让你的整个网站停止相应。因为这两个操作是会锁表的,表一锁住了,别的操作都进不来了。u003Cu002Fpu003Eu003Cpu003E Apache 会有很多的子进程或线程。所以,其工作起来相当有效率,而我们的服务器也不希望有太多的子进程,线程和数据库链接,这是极大的占服务器资源的事情,尤其是内存。u003Cu002Fpu003Eu003Cpu003E 如果你把你的表锁上一段时间,比如30秒钟,那么对于一个有很高访问量的站点来说,这30秒所积累的访问进程u002F线程,数据库链接,打开的文件数,可能不仅仅会让你的WEB服务崩溃,还可能会让你的整台服务器马上挂了。所以,如果你有一个大的处理,你一定把其拆分,使用 LIMIT ,oracle(rownum),sqlserver(top)条件是一个好的方法。u003Cu002Fpu003Eu003Cpu003E OK,以上介绍的这些SQL的优化方式,但实际上使用还是需要大家自己养成良好的编程习惯的。根据自己的业务需求适当的进行优化操作,相信能让你的系统运行效率得到很大提升。u003Cu002Fpu003Eu003Cpu003E学习资源:u003Cu002Fpu003Eu003Cpu003Eu003Ca class=”pgc-link” data-content=”mp” href=”http:u002Fu002Fyun.itheima.comu002Fopenu002F189.html?jrtt” target=”_blank”u003EMySQL优化-教你如何全面的对数据库进行优化u003Cu002Fau003Eu003Cu002Fpu003Eu003Cpu003E想获取源码可后台回复:MySQLu003Cu002Fpu003Eu003Cu002Fdivu003E”

原文始发于:大数据量环境下的SQL优化

主题测试文章,只做测试使用。发布者:程序员,转转请注明出处:http://www.cxybcw.com/26794.html

联系我们

13687733322

在线咨询:点击这里给我发消息

邮件:1877088071@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

QR code