之前经常看到一些关于oracle优化的方法,但是数据量比较小时都不太关注这些,但是真正遇到这些问题,大数据量时如果sql写的不合适,效率将非常低,浪费我们大量的时间。

  • 统计总数
    差不多从学sql开始就知道count(*)可以用来统计总数,但是同一记录统计总数的sql不同差别也很大,我们在700多万的一个表里执行count(*)耗时70多秒,count(1)耗时50多秒,count(索隐列)耗时7秒,可以看出差别还是很大的。

  • 统计不在某范围的数据

  • not in

  • not exists

  • minus
    三者的效率差别也特别大,我们经常会遇到求不在某一范围的数据。这三种方式都能实现,数据量在10000左右时not in 的效率已经非常慢了。
    minus是对结果集直接求差集
    (结果A)minus(结果B)效率很高,not exists (select * from A where not exists in (select * from B where A.主键=B.主键))
    not in
    ( select * from A where A.主键 not in(select B.主键 from B where A.主键=B.主键))
    三者的效率 minus>not exists>not in

Logo

永洪科技,致力于打造全球领先的数据技术厂商,具备从数据应用方案咨询、BI、AIGC智能分析、数字孪生、数据资产、数据治理、数据实施的端到端大数据价值服务能力。

更多推荐