pcre_exec()的函数定义是
int pcre_exec(const pcre *code,const pcre_extra *extra,@H_301_3@ const char *subject,int length,int startoffset,@H_301_3@ int options,int *ovector,int ovecsize);@H_301_3@
int rc;
int ovector[30]; @H_301_3@ rc = pcre_exec( @H_301_3@re,/* pcre_compile()的结果 */
NULL,/* pcre_study()的结果,study可以加速算法,没有则设为NULL */
"some string",/* 匹配的字符串subject string,其中可以包含\0 */
11,/* 上述字符串长度,因为上面字符串可以包含\0,所以长度在这个地方指出 */
0,/* subject string开始匹配的offset,看api,貌似pcre不支持形如/g这样的匹配全部的选项,需要通过循环+调整这个偏移量,自己来实现这个功能 */
0,/* default options */
ovector,/* 匹配结果的数组*/
30); /* ovector的数组长度 */
@H_301_3@
返回值rc:
当rc<0表示匹配发生error,==0,没有匹配上,>0返回匹配到的元素数量
ovector是一个int型数组,其长度必须设定为3的倍数,若为3n,则最多返回n个元素,显然有rc<=n
其中ovector[0],[1]为整个匹配上的字符串的首尾偏移;其他[2*i][2*i+1]为对应第i个匹配上的子串的偏移,子串意思是正则表达式中被第i个()捕获的字符串,计数貌似是按照(出现的顺序。
如正则式/abc((.*)cf(exec))test/,在目标字符串11111abcword1cfexectest11111中匹配,将返回4个元素,其首尾偏移占用ovector的0~7位
元素0=abcword1cfexectest,
元素1=word1cfexec
元素2=word1
元素3=exec
ovector的最后1/3个空间,即[2n~3n-1],貌似为pcre正则匹配算法预留,不返回结果@H_301_3@
@H_301_3@
参考资料:http://swoolley.org/man.cgi/3/pcreapi
原文链接:https://www.f2er.com/regex/362660.html