关于SQL中CTE（公用表表达式）（Common Table Expression）的总结

一．WITH AS的含义

WITH AS短语，也叫做子查询部分（subquery factoring），可以让你做很多事情，定义一个sql片断，该sql片断会被整个sql语句所用到。有的时候，是为了让sql语句的可读性更高些，也有可能是在UNION ALL的不同部分，作为提供数据的部分。
特别对于UNION ALL比较有用。因为UNION ALL的每个部分可能相同，但是如果每个部分都去执行一遍的话，则成本太高，所以可以使用WITH AS短语，则只要执行一遍即可。如果WITH AS短语所定义的表名被调用两次以上，则优化器会自动将WITH AS短语所获取的数据放入一个TEMP表里，如果只是被调用一次，则不会。而提示materialize则是强制将WITH AS短语里的数据放入一个全局临时表里。很多查询通过这种方法都可以提高速度。

二．使用方法

先看下面一个嵌套的查询语句：

代码如下:

select * from person.StateProvince where CountryRegionCode in 
(select CountryRegionCode from person.CountryRegion where Name like 'C%') 

上面的查询语句使用了一个子查询。虽然这条sql语句并不复杂，但如果嵌套的层次过多，会使sql语句非常难以阅读和维护。因此，也可以使用表变量的方式来解决这个问题，sql语句如下：

代码如下:

declare @t table(CountryRegionCode nvarchar(3)) 
insert into @t(CountryRegionCode) (select CountryRegionCode from person.CountryRegion where Name like 'C%') 
select * from person.StateProvince where CountryRegionCode 
in (select * from @t) 

虽然上面的sql语句要比第一种方式更复杂，但却将子查询放在了表变量@t中，这样做将使sql语句更容易维护，但又会带来另一个问题，就是性能的损失。由于表变量实际上使用了临时表，从而增加了额外的I/O开销，因此，表变量的方式并不太适合数据量大且频繁查询的情况。为此，在sql Server 2005中提供了另外一种解决方案，这就是公用表表达式（CTE），使用CTE，可以使sql语句的可维护性，同时，CTE要比表变量的效率高得多。
下面是CTE的语法：

代码如下:

[ WITH  [,n ] ] 
::= 
expression_name [ ( column_name [,n ] ) ] 
AS 
( CTE_query_definition ) 

现在使用CTE来解决上面的问题，sql语句如下：

代码如下:

with 
cr as 
( 
select CountryRegionCode from person.CountryRegion where Name like 'C%' 
) 
select * from person.StateProvince where CountryRegionCode in (select * from cr) 

其中cr是一个公用表表达式，该表达式在使用上与表变量类似，只是sql Server 2005在处理公用表表达式的方式上有所不同。
在使用CTE时应注意如下几点：
1. CTE后面必须直接跟使用CTE的sql语句（如select、insert、update等），否则，CTE将失效。如下面的sql语句将无法正常使用CTE：

代码如下:

with
cr as
(
select CountryRegionCode from person.CountryRegion where Name like 'C%'
)
select * from person.CountryRegion -- 应将这条sql语句去掉
-- 使用CTE的sql语句应紧跟在相关的CTE后面 --
select * from person.StateProvince where CountryRegionCode in (select * from cr)

2. CTE后面也可以跟其他的CTE，但只能使用一个with，多个CTE中间用逗号（,）分隔，如下面的sql语句所示：

代码如下:

with 
cte1 as 
( 
select * from table1 where name like 'abc%' 
),
cte2 as 
( 
select * from table2 where id > 20 
),
cte3 as 
( 
select * from table3 where price < 100 
) 
select a.* from cte1 a,cte2 b,cte3 c where a.id = b.id and a.id = c.id 

3. 如果CTE的表达式名称与某个数据表或视图重名，则紧跟在该CTE后面的sql语句使用的仍然是CTE，当然，后面的sql语句使用的就是数据表或视图了，如下面的sql语句所示：

代码如下:

-- table1是一个实际存在的表 
with 
table1 as 
( 
select * from persons where age < 30 
) 
select * from table1 -- 使用了名为table1的公共表表达式 
select * from table1 -- 使用了名为table1的数据表 

4. CTE 可以引用自身，也可以引用在同一 WITH 子句中预先定义的 CTE。不允许前向引用。
5. 不能在 CTE_query_definition 中使用以下子句：
（1）COMPUTE 或 COMPUTE BY
（2）ORDER BY（除非指定了 TOP 子句）
（3）INTO
（4）带有查询提示的 OPTION 子句
（5）FOR XML
（6）FOR BROWSE
6. 如果将 CTE 用在属于批处理的一部分的语句中，那么在它之前的语句必须以分号结尾，如下面的sql所示：

代码如下:

declare @s nvarchar(3) 
set @s = 'C%' 
; -- 必须加分号 
with 
t_tree as 
( 
select CountryRegionCode from person.CountryRegion where Name like @s 
) 
select * from person.StateProvince where CountryRegionCode in (select * from t_tree) 

CTE除了可以简化嵌套sql语句外，还可以进行递归调用。微软从sql2005起引入了CTE(Common Table Expression)以强化T-sql。这是一个类似于非持久视图的好东东。

按照MSDN介绍

1、公用表表达式 (CTE) 可以认为是在单个 SELECT、INSERT、UPDATE、DELETE 或 CREATE VIEW 语句的执行范围内定义的临时结果集。CTE 与派生表类似，具体表现在不存储为对象，并且只在查询期间有效。与派生表的不同之处在于，CTE 可自引用，还可在同一查询中引用多次。
CTE 可用于：
创建递归查询。有关详细信息，请参阅使用公用表表达式的递归查询。在不需要常规使用视图时替换视图，也就是说，不必将定义存储在元数据中。启用按从标量嵌套 select 语句派生的列进行分组，或者按不确定性函数或有外部访问的函数进行分组。
在同一语句中多次引用生成的表。使用 CTE 可以获得提高可读性和轻松维护复杂查询的优点。查询可以分为单独块、简单块、逻辑生成块。之后，这些简单块可用于生成更复杂的临时 CTE，直到生成最终结果集。可以在用户定义的例程（如函数、存储过程、触发器或视图）中定义 CTE。
2、公用表表达式 (CTE) 具有一个重要的优点，那就是能够引用其自身，从而创建递归 CTE。递归 CTE 是一个重复执行初始 CTE 以返回数据子集直到获取完整结果集的公用表表达式。当某个查询引用递归 CTE 时，它即被称为递归查询。递归查询通常用于返回分层数据，例如：显示某个组织图中的雇员或物料清单方案（其中父级产品有一个或多个组件，而那些组件可能还有子组件，或者是其他父级产品的组件）中的数据。
递归 CTE 可以极大地简化在 SELECT、INSERT、UPDATE、DELETE 或 CREATE VIEW 语句中运行递归查询所需的代码。在 sql Server 的早期版本中，递归查询通常需要使用临时表、游标和逻辑来控制递归步骤流。有关公用表表达式的详细信息，请参阅使用公用表表达式。这里举例说明如下：为了描述方便，邀月特地列举了一个常见的自关联Table
表结构如下：
表结构

代码如下:

CREATE TABLE [dbo].[CategorySelf]( 
[PKID] [int] IDENTITY(1,1) NOT NULL,
[C_Name] [nvarchar](50) NOT NULL,
[C_Level] [int] NOT NULL,
[C_Code] [nvarchar](255) NULL,
[C_Parent] [int] NOT NULL,
[InsertTime] [datetime] NOT NULL,
[InsertUser] [nvarchar](50) NULL,
[UpdateTime] [datetime] NOT NULL,
[UpdateUser] [nvarchar](50) NULL,
[SortLevel] [int] NOT NULL,
[CurrState] [smallint] NOT NULL,
[F1] [int] NOT NULL,
[F2] [nvarchar](255) NULL CONSTRAINT [PK_OBJECTCATEGORYSELF] PRIMARY KEY CLUSTERED 
( 
[PKID] ASC 
)WITH (PAD_INDEX = OFF,STATISTICS_NORECOMPUTE = OFF,IGNORE_DUP_KEY = OFF,ALLOW_ROW_LOCKS = ON,ALLOW_PAGE_LOCKS = ON) ON [PRIMARY] 
) ON [PRIMARY] GO 

再插入一些测试数据

代码如下:

Insert
INSERT INTO [CategorySelf]([C_Name],[C_Level],[C_Code],[C_Parent],[InsertTime],[InsertUser],[UpdateTime],[UpdateUser],[SortLevel],[CurrState],[F1],[F2])
select '分类1',1,'0',GETDATE(),'testUser',DATEADD(dd,getdate()),'CrackUser',13,'邀月备注' union all
select '分类2',78,12,'邀月备注' union all
select '分类3',6,10,'邀月备注' union all
select '分类4',2,'1',75,19,'邀月备注' union all
select '分类5','2',3,17,'邀月备注' union all
select '分类6','1/4',4,16,'邀月备注' union all
select '分类7',5,'邀月备注' union all
select '分类8','2/5','邀月备注' union all
select '分类9','1/4/6',7,'邀月备注' union all
select '分类10',63,'邀月备注' union all
select '分类11',8,83,'邀月备注' union all
select '分类12','2/5/8','邀月备注' union all
select '分类13',15,'邀月备注'

一个典型的应用场景是：在这个自关联的表中，查询以PKID为2的分类包含所有子分类。也许很多情况下，我们不得不用临时表/表变量/游标等。现在我们有了CTE，就简单多了

代码如下:

CTEDemo1 
WITH SimpleRecursive(C_Name,PKID,C_Code,C_Parent) 
AS 
(SELECT C_Name,C_Parent FROM CategorySelf WHERE PKID = 2 
UNION ALL 
SELECT p.C_Name,p.PKID,p.C_Code,p.C_parent 
FROM CategorySelf P INNER JOIN 
SimpleRecursive A ON A.PKID = P.C_Parent 
) 
SELECT sr.C_Name as C_Name,c.C_Name as C_ParentName,sr.C_Code as C_ParentCode 
FROM SimpleRecursive sr inner join CategorySelf c 
on sr.C_Parent=c.PKID 

查询结果如下：C_Name C_ParentName C_ParentCode
分类5 分类2 2
分类8 分类5 2/5
分类12 分类8 2/5/8
分类13 分类8 2/5/8
感觉怎么样？如果我只想查询第二层，而不是默认的无限查询下去，
可以在上面的sql后加一个选项 Option(MAXRECURSION 5)，注意5表示到第5层就不往下找了。如果只想找第二层，但实际结果有三层，此时会出错，
Msg 530,Level 16,State 1,Line 1
The statement terminated. The maximum recursion 1 has been exhausted before statement completion.
此时可以通过where条件来解决，而保证不出错，看如下sql语句：
CTEDemo2

代码如下:

WITH SimpleRecursive(C_Name,C_Parent,Sublevel) 
AS 
(SELECT C_Name,0 FROM CategorySelf WHERE PKID = 2 
UNION ALL 
SELECT p.C_Name,p.C_parent,Sublevel+1 
FROM CategorySelf P INNER JOIN 
SimpleRecursive A ON A.PKID = P.C_Parent 
) 
SELECT sr.C_Name as C_Name,sr.C_Code as C_ParentCode 
FROM SimpleRecursive sr inner join CategorySelf c 
on sr.C_Parent=c.PKID 
where SubLevel<=2 

查询结果：
C_Name C_ParentName C_ParentCode
分类5 分类2 2
分类8 分类5 2/5
当然，我们不是说CTE就是万能的。通过好的表设计也可以某种程度上解决特定的问题。下面用常规的sql实现上面这个需求。
注意：上面表中有一个字段很重要，就是C_Code，编码,格式如"1/2"，“2/5/8"表示该分类的上级分类是1/2,2/5/8
这样，我们查询就简单多，查询以PKID为2的分类包含所有子分类：

代码如下:

SELECT C_Name as C_Name,(Select top 1 C_Name from CategorySelf s where c.C_Parent=s.PKID) as C_ParentName,C_Code as C_ParentCode 
from CategorySelf c where C_Code like '2/%' 

查询以PKID为2的分类包含所有子分类，且级别不大于3

代码如下:

SELECT C_Name as C_Name,C_Code as C_ParentCode 
from CategorySelf c where C_Code like '2/%' and C_Level<=3 

查询结果同上，略去。这里我们看出，有时候，好的表结构设计相当重要。
邀月于2009.10.23 1:36 完成分享。
有人很关心性能问题。目前没有测试过。稍后会附上百万级测试报告。不过，有两点理解邀月忘了补充：
一、CTE其实是面向对象的，运行的基础是CLR。一个很好的说明是With查询语句中是区分字段的大小写的。即"C_Code"和"c_Code"是不一样的，后者会报错。这与普通的sql语句不同。
二、这个应用示例重在简化业务逻辑，即便是性能不佳，但对临时表/表变量/游标等传统处理方式是一种业务层次上的简化或者说是优化。公用表表达式 (CTE) 可以认为是在单个 SELECT、INSERT、UPDATE、DELETE 或 CREATE VIEW 语句的执行范围内定义的临时结果集。CTE 与派生表类似，具体表现在不存储为对象，并且只在查询期间有效。与派生表的不同之处在于，CTE 可自引用，还可在同一查询中引用多次。
CTE 可用于：
创建递归查询。
在不需要常规使用视图时替换视图，也就是说，不必将定义存储在元数据中。
启用按从标量嵌套 select 语句派生的列进行分组，或者按不确定性函数或有外部访问的函数进行分组。
在同一语句中多次引用生成的表。
使用 CTE 可以获得提高可读性和轻松维护复杂查询的优点。查询可以分为单独块、简单块、逻辑生成块。之后，这些简单块可用于生成更复杂的临时 CTE，直到生成最终结果集。
可以在用户定义的例程（如函数、存储过程、触发器或视图）中定义 CTE。
CTE 的结构
CTE 由表示 CTE 的表达式名称、可选列列表和定义 CTE 的查询组成。定义 CTE 后，可以在 SELECT、INSERT、UPDATE 或 DELETE 语句中对其进行引用，就像引用表或视图一样。CTE 也可用于 CREATE VIEW 语句，作为定义 SELECT 语句的一部分。
CTE 的基本语法结构如下：
WITH expression_name [ ( column_name [,...n] ) ]
AS
( CTE_query_definition )
只有在查询定义中为所有结果列都提供了不同的名称时，列名称列表才是可选的。
运行 CTE 的语句为：
SELECT
FROM expression_name
示例:

代码如下:

with s_name as
(
select s.name,sc.c,sc.grade from sql Server student AS s,sc
where s.s#=sc.s#
)
select * from s_name

在使用CTE时应注意如下几点：
1. CTE后面必须直接跟使用CTE的sql语句（如select、insert、update等），否则，CTE将失效。
2. CTE后面也可以跟其他的CTE，但只能使用一个with，多个CTE中间用逗号（,）分隔。
3. 如果CTE的表达式名称与某个数据表或视图重名，则紧跟在该CTE后面的sql语句使用的仍然是CTE，当然，后面的sql语句使用的就是数据表或视图了。
4. CTE 可以引用自身（递归查询），也可以引用在同一 WITH 子句中预先定义的 CTE。不允许前向引用。
5. 不能在 CTE_query_definition 中使用以下子句：
（1）COMPUTE 或 COMPUTE BY
（2）ORDER BY（除非指定了 TOP 子句）
（3）INTO
（4）带有查询提示的 OPTION 子句
（5）FOR XML
（6）FOR BROWSE
6. 如果将 CTE 用在属于批处理的一部分的语句中，那么在它之前的语句必须以分号结尾。

关于SQL中CTE（公用表表达式）（Common Table Expression）的总结

一．WITH AS的含义

二．使用方法

按照MSDN介绍

猜你在找的Express 相关文章