sql – LEFT JOIN显着快于INNER JOIN

前端之家收集整理的这篇文章主要介绍了sql – LEFT JOIN显着快于INNER JOIN前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我有一张表(MainTable),有超过60万条记录.它通过父/子类型关系中的第二个表(JoinTable)连接到自己上:
SELECT   Child.ID,Parent.ID
FROM     MainTable
AS       Child
JOIN     JoinTable
      ON Child.ID = JoinTable.ID
JOIN     MainTable
AS       Parent
      ON Parent.ID = JoinTable.ParentID
     AND Parent.SomeOtherData = Child.SomeOtherData

我知道每个子记录都有父记录,并且JoinTable中的数据是acurate.

当我运行这个查询时,需要几分钟的时间才能运行.但是,如果我使用Left Join加入Parent,1秒运行:

SELECT   Child.ID,Parent.ID
FROM     MainTable
AS       Child
JOIN     JoinTable
      ON Child.ID = JoinTable.ID
LEFT JOIN MainTable
AS       Parent
      ON Parent.ID = JoinTable.ParentID
     AND Parent.SomeOtherData = Child.SomeOtherData
WHERE    ...[some info to make sure we don't select parent records in the child dataset]...

我了解INNER JOIN和LEFT JOIN之间的结果差异.在这种情况下,它返回完全相同的结果,因为每个孩子都有一个父项.如果我让两个查询运行,我可以比较数据集,它们是完全一样的.

为什么LEFT JOIN比INNER JOIN快得多?

UPDATE
检查查询计划以及使用内部连接时,将从父数据集开始.当执行左连接时,它将以子数据集开头.

它使用的索引都是一样的.

我可以强迫它总是从孩子开始吗?使用左连接工作,只是感觉错误.

以前曾经问过类似的问题,但似乎没有回答我的问题.

例如INNER JOIN vs LEFT JOIN performance in SQL Server中选择的答案说,左连接总是比内连接慢.这个论点是有道理的,但这不是我所看到的.

解决方法

左连接似乎更快,因为sql被迫先做较小的选择,然后加入到这个较小的记录集中.由于某种原因,优化器不想自然而然.

3种方式强制联合以正确的顺序发生:

>将数据的第一个子集选择到临时表(或表变量)中,然后加入
>使用左连接(并记住这可能会返回不同的数据,因为它是一个左连接而不是内连接)
>使用FORCE ORDER关键字.请注意,如果表格大小或模式发生更改,则查询计划可能不正确(请参阅https://dba.stackexchange.com/questions/45388/forcing-join-order)

猜你在找的MsSQL相关文章