介绍
PCRE (Perl Compatible Regular Expressions) 是一个用C语言编写的正则表达式函数库。本文简要介绍PCRE的编译和使用方法。
编译
从PCRE官网下载后,解压(本人下的版本为pcre2-10.21)。仔细阅读 README 和 NON-AUTOTOOLS-BUILD,里面介绍了很多编译的方法。由于本人需要在VS下开发,因此选择CMake编译。
1. 打开 VS开发人员命令提示符,切换到CMake\bin\下,运行cmake-gui.exe
2. 设置源文件目录为PCRE的解压目录。
3. 在PCRE的解压目录下创建build文件夹,将该文件夹设置为编译目录。
4. 点击Configure按钮,会弹出选择编译器的提示框,选择VS编译器的版本,点击Finish按钮。
5. 配置成功后,会在配置列表中显示所有的配置项,这里按照实际需要修改。本人只修改了CMAKE_INSTALL_PREFIX,即安装目录,其他保持默认。若修改了配置项,则需要重新点击Configure以使之生效。
6. 点击Generate按钮,成功后会在build下生成所需要的VS工程文件和解决方案文件。
7. VS打开解决方案文件,解决方案配置为Release版本,编译工程ALL_BUILD,则会在build\Release下生成库文件。
8. 编译工程INSTALL,则会在CMAKE_INSTALL_PREFIX指定的目录下生成头文件、库文件和相应的手册。在share\doc下面会生成html形式的API说明文档。
使用
- 建立工程的时候需要配置字符长度,例如定义宏 PCRE2_CODE_UNIT_WIDTH=8
- 如果使用静态库,需要定义宏 PCRE2_STATIC
- 这里仅列出简单的使用说明,具体的API使用方法详见API说明文档。
#include "pcre2.h"
#include <string>
#include <iostream>
int main(void)
{
const std::string pattern{ "\\d{3,5}" };
int error_code = 0;
PCRE2_SIZE error_offset = 0;
pcre2_code *code = pcre2_compile(reinterpret_cast<PCRE2_SPTR>(pattern.c_str()),PCRE2_ZERO_TERMINATED,0,&error_code,&error_offset,NULL);
if (code == NULL)
{
return -1;
}
const std::string subject{ "tel1:1234;tel2:3456;tel3:5678" };
pcre2_match_data *match_data = pcre2_match_data_create_from_pattern(code,NULL);
int rc = 0;
int start_offset = 0;
unsigned int match_index = 0;
while ((rc = pcre2_match(code,reinterpret_cast<PCRE2_SPTR>(subject.c_str()),subject.length(),start_offset,match_data,NULL)) > 0)
{
PCRE2_SIZE *ovector = pcre2_get_ovector_pointer(match_data);
int i = 0;
for (i = 0; i < rc; i++)
{
std::cout << "match " << ++match_index << ": "
<< std::string(subject.c_str() + ovector[2*i],ovector[2*i + 1] - ovector[2*i])
<< std::endl;
}
start_offset = ovector[2*(i-1) + 1];
}
return 0;
}