最近在做了一个关于postgresql相关的项目,个人工作中遇到了关于字符串模式匹配的工作,以下是我阅读
postgre官方文档中对similar to 和 like的说明的个人笔记:
string LIKE pattern [ ESCAPE escape-character ]
每个 pattern 定义一个字串的集合。 如果该 string 包含在 pattern 代表的字串集合里,那么 LIKE
表达式返回真。如果 pattern 不包含百分号或者下划线,那么该模式只代表它本身,这时候 LIKE
的行为就象等号操作符。在 pattern 里的下划线(_)代表(匹配)任何单个字符;而一个百分号(%)匹配任何零或更多字符长的字串。
例如:
'abc' LIKE 'abc' true
'abc' LIKE 'a%' true
'abc' LIKE '_b_' true
'abc' LIKE 'c' false
string SIMILAR TO pattern [ESCAPE escape-character]
SIMILARTO
根据自己的模式是否匹配给定字串而返回真或者假。它和 LIKE
非常类似,只不过它使用sql标准定义的正则表达式理解模式。sql 标准的正则表达式是在LIKE
表示法和普通的正则表达式表示法之间古怪的交叉。类似 LIKE
,SIMILAR TO
操作符只有在它的模式匹配整个字串的时候才能成功;这一点和普通的正则表达式的习惯不同,在普通的正则表达式里,模式匹配字串的任意部分。和 LIKE
类似的地方还有,SIMILAR TO
使用 _ 和 % 作为分别代表任意字串和任意字串字符的通配符。(这些和 POSIX 正则表达式里的 . 和 .* 兼容)除了这些从 LIKE
借用的功能之外, SIMILAR TO
支持下面这些从 POSIX 正则表达式借用的模式匹配元字符:
·| 标识选择(两个候选之一)。
·* 表示重复前面的项零次或更多次。
·+ 表示重复前面的项一次或更多次。
·可以使用圆括弧 () 把项组合成一个逻辑项。
·一个方括弧表达式 [...] 声明一个字符表, 就像 POSIX 正则表达式一样。
例如:
'abc' SIMILAR TO 'abc' true
'abc' SIMILAR TO 'a' false
'abc' SIMILAR TO '%(b|d)%' true
'abc' SIMILAR TO '(b|c)%' false