sql-server – 这些使用OR的T-SQL查询有什么区别？

我使用Microsoft sql Server 2008(SP1,x64).我有两个相同的查询,或者我认为,但它们具有完全不同的查询计划和性能.

SELECT c_pk
FROM table_c
WHERE c_b_id IN (SELECT b_id FROM table_b WHERE b_z = 1)
  OR  c_a_id IN (SELECT a_id FROM table_a WHERE a_z = 1)

查询2：

SELECT c_pk
FROM table_c
LEFT JOIN (SELECT b_id FROM table_b WHERE b_z = 1) AS b ON c_b_id = b_id
LEFT JOIN (SELECT a_id FROM table_a WHERE a_z = 1) AS a ON c_a_id = a_id
WHERE b_id IS NOT NULL
  OR  a_id IS NOT NULL

如我所料,查询1速度很快,而查询2速度很慢. query plans看起来很不一样.

我想查询2与查询1一样快.我有使用查询2的软件,我无法将其更改为查询1.我可以更改数据库.

一些问题：

>为什么查询计划不同？
>我可以以某种方式“教”sql Server查询2等于查询1吗？

所有表都具有(群集的)主键和所有列上的正确索引：

CREATE TABLE table_a (
  a_pk   int NOT NULL PRIMARY KEY,a_id   int NOT NULL UNIQUE,a_z    int
)
GO
CREATE INDEX IX_table_a_z ON table_a (a_z)
GO

CREATE TABLE table_b (
  b_pk   int NOT NULL PRIMARY KEY,b_id   int NOT NULL UNIQUE,b_z    int
)
GO
CREATE INDEX IX_table_b_z ON table_b (b_z)
GO

CREATE TABLE table_c (
  c_pk   int NOT NULL PRIMARY KEY,c_a_id int,c_b_id int
)
GO
CREATE INDEX IX_table_c_a_id ON table_c (c_a_id)
GO
CREATE INDEX IX_table_c_b_id ON table_c (c_b_id)
GO

最初填写后,表格不会被修改.我是唯一一个查询他们的人.它们包含数百万条记录(table_a：5M,table_b：4M,table_c：12M),但仅使用1％会得到类似的结果.

编辑：我尝试为c_a_id和c_b_id添加FOREIGN KEY,但这只会使查询1变慢…

我希望有人可以看看query plans并解释其中的差异.

解决方法

加入速度较慢,让我说说设计.第一个查询使用子查询(可缓存)来过滤记录,因此它将产生更少的数据(并减少对每个表的访问).

你读过这些了吗：

> http://www.sql-server-performance.com/2006/tuning-joins/
> http://blogs.msdn.com/b/craigfr/archive/2006/12/04/semi-join-transformation.aspx

我的意思是,在数据库中可以做更好的优化,例如删除重复项,在第一场比赛时停止和类似(这些都来自学校的记忆,所以我相信它会做得更好).所以我想这个问题并不是QP与众不同的原因,而是多么深刻的优化程度.

sql-server – 这些使用OR的T-SQL查询有什么区别？

解决方法

猜你在找的MsSQL相关文章