联合正则路径查询
- 通过结合
CQ
和
RPQ
得到
CRPQ
,形式如
(2)
比较并返回路径
- 在某些场景下(例如找出web上联通的数据),需要指定路径间的关系同时得到实际的路径作为查询结果
-
ECRPQ
提供以上两种特性,
ECRPQ
在两个层面上扩展了
CRPQ
- 允许查询的头部存在自由路径变量
- 允许校验查询体中路径间的关系而不是简单的令路径和正则语言相匹配
- 我们首先基于
Σ
@H_404_262@Σ定义正则关系的规范。设
⊥
为一个独立于
Σ
的符号,利用
⊥
扩展
Σ
得到
Σ⊥
- 设
x¯=(s1,s2,...sn)
为一个基于
Σ
的字符串的
n
元组。构造一个基于
(Σ⊥)n
字符串
[s¯]
,其长度是
sj
的最大值,且第
i
个符号是一个元组
(c1,...,cn)
(当
sk
的长度至少是
i
时,每个
ck
等于
sk
的第
i
个符号,否则等于
⊥
)。也就是说我们用
⊥
填补短字符串,从而把
n
个字符串视作一个字符串。对于任何
@H_502_1012@Σ∗
中的
n
元关系
S
,当基于
(Σ⊥)n
@H_404_1152@(Σ_{\bot})^n的字符串集合
[s¯]|s¯∈S
能被基于
(Σ⊥)n
的正则自动机接受或者能用基于
(Σ⊥)n
正则表达式表示,则被认为是正则的。我们也应当利用相同的字母来表示基于
(Σ⊥)n
的正则表达式和基于
@H_502_1012@Σ∗
的关系
- 除了
CRPQ
中的节点变量,我们还确定了一个可数路径变量集合(用
@H_522_1502@π,ω,χ
来表示)。一条基于
Σ
的扩展联合正则路径请求
ECRPQ
的表达式为:
ans(z¯,χ¯@H_404_1663@)←⋀1≤i≤m(xi,@H_403_1718@πi,yi),⋀1≤j≤tRj(ω¯j)
-
m>0,t≥0
- 每个
Rj
是一个定义了正则关系的正则表达式
-
x¯=(x1,...,xm)
和
y¯=(y1,...,ym)
都是节点变量元组
-
π¯=(π1,...,πm)
是路径变量元组
-
{w¯1,...,w¯@H_371_2301@t}
是不同的路径变量元组,例如
w¯@H_371_2301@j
是一个
π¯
中变量的元组,变量数目等于
Rj
-
z¯
是一个
x¯,y¯
中节点变量的元组
-
χ¯
是一个
π¯
中路径变量的元组
-
ECRPQ
的语义是
CRP@H_502_2713@Q
的延伸。对于一个
ECRPQ
的查询,从节点变量到节点的映射关系为
σ
,从路径变量到路径的映射关系为
μ
,当满足以下两个条件时,则可认为
(G,σ,μ)|=Q
:
-
μ(πi)
是
G
中的一条从
σ(xi)
到
σ(y@H_510_3015@i)
的路径,
1≤i≤m
- 对于每个
w¯@H_371_2301@j=(πj1,...,πjk)
,由
μ(πj1),...μ(π@H_593_3301@jk)
中标签组成的字符串元组属于关系
Rj
- 查询结果可定义为:
Q(G)={(@H_646_3403@σ(z¯),μ(χ¯))|(G,σ,μ)|=Q}
- 举例说明:
- 在
RDF
的查询语句中,路径可以被基于特定的语义关联比较。边相当于
RDF
属性路径相当于属性序列。定义属性
a
是
b
的子属性
a≺b
。两个属性序列
u
和
v
被称作
ρ−isomorphic
(路径同构)当且仅当
u=u1,...,un
和
v=v1,...,vn
且
ui≺vi
或
vi≺ui
,
1≤i≤n
。节点
x
@H_112_4037@x和@H_41_4041@
@H_463_4043@@H_704_4046@@H_652_4047@y
被称作
ρ−isoAssociated
(路径关联)当且仅当
x
和
y
是两条同构路径属性序列的起点。
- 找出路径关联的节点无法使用
CRPQ
表示,因为这需要保证两条路径长度相同。然而,路径同构的属性对能用基于表达式
(⋃a,b∈σ:(a≺b⋁b≺a)(a,b))∗
的正则关系
@H_940_4301@R
来表示。一个
ECRPQ
返回路径关联的点对
x
和
y
可以被写成以下形式:
@H_522_4
404@
ans(x,y)←(x,π1,z1),(y,π2,z2),R(π1,π2)
ECRPQ
中的路径变量也可以被用来返回找出的实际路径。例如我们需要找出
RDF
资源
r
和
s
间的每条路径,且路径包含资源
e
,可以用以下形式表示:
ans(π1,π2)←(r,π1,e),(e,π2,s)
π1
和
π2
为实际路径
- 包含回溯引用的正则表达式
(REBR)
,正如
egrep
和
Perl
@H_675_5029@Perl中所提供的。举个例子,
(r)%X
,
r
是正则表达式,
X
是变量(绑定字符串
@H_403_5117@w∈L(r)
到
X
)。然后用表达式中的
X
去匹配
w
。
ECRPQ
不能表示所有的
REBR
,但另一方面,
ECRPQ
能匹配模式,例如
@H_502_1012@anbncn
ans(x,y)←(x,π1,z1),(z1,π2,z@H_502_5511@2),(z2,π3,y),a∗(@H_404_5593@π1),b∗(π2),c∗(π3),el(π1,π2),el(π2,π3)
el(π,π′)
是的简写
(⋃a,b∈σ(a,b))∗(π,π′)
原文链接:https://www.f2er.com/regex/360086.html