正则表达式在 PHP 中的应用

前端之家收集整理的这篇文章主要介绍了正则表达式在 PHP 中的应用前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。

PHP 应用中,正则表达式主要用于:


正则匹配:根据正则表达式匹配相应的内容

正则替换:根据正则表达式匹配内容并替换

正则分割:根据正则表达式分割字符串

PHP 中有两类正则表达式函数,一类是 Perl 兼容正则表达式函数,一类是 POSIX 扩展正则表达式函数。二者差别不大,而且推荐使用Perl 兼容正则表达式函数,因此下文都是以 Perl 兼容正则表达式函数为例子说明。


定界符


Perl 兼容模式的正则表达式函数,其正则表达式需要写在定界符中。任何不是字母、数字或反斜线()的字符都可以作为定界符,通常我们使用 / 作为定界符。具体使用见下面的例子。


提示


尽管正则表达式功能非常强大,但如果用普通字符串处理函数能完成的,就尽量不要用正则表达式函数,因为正则表达式效率会低得多。关于普通字符串处理函数,请参见《PHP 字符串处理》。


preg_match()


preg_match() 函数用于进行正则表达式匹配,成功返回 1 ,否则返回 0 。


语法:


int preg_match( string pattern,string subject [,array matches ] )

参数说明:

参数 说明

pattern 正则表达式

subject 需要匹配检索的对象

matches 可选,存储匹配结果的数组, $matches[0] 将包含与整个模式匹配的文本,$matches[1] 将包含与第一个捕获的括号中的子模式所匹配的文本,以此类推

例子 1 :


<?PHP

if(preg_match("/PHP/i","PHP is the web scripting language of choice.",$matches)){

print "A match was found:". $matches[0];

} else {

print "A match was not found.";

}

?>

浏览器输出


A match was found: PHP

在该例子中,由于使用了 i 修正符,因此会不区分大小写去文本中匹配 PHP


提示


preg_match() 第一次匹配成功后就会停止匹配,如果要实现全部结果的匹配,即搜索到subject结尾处,则需使用 preg_match_all() 函数


例子 2 ,从一个 URL 中取得主机域名 :


<?PHP

// 从 URL 中取得主机名

preg_match("/^(http://)?([^/]+)/i","http://www.5idev.com/index.html",$matches);

$host = $matches[2];

// 从主机名中取得后面两段

preg_match("/[^./]+.[^./]+$/",$host,$matches);

echo "域名为:{$matches[0]}";

?>

浏览器输出


域名为:5idev.com

preg_match_all()


preg_match_all() 函数用于进行正则表达式全局匹配,成功返回整个模式匹配的次数(可能为零),如果出错返回 FALSE 。


语法:


int preg_match_all( string pattern,string subject,array matches [,int flags ] )

参数说明:

参数 说明

pattern 正则表达式

subject 需要匹配检索的对象

matches 存储匹配结果的数组

flags

可选,指定匹配结果放入 matches 中的顺序,可供选择的标记有:


PREG_PATTERN_ORDER:默认,对结果排序使 $matches[0] 为全部模式匹配的数组,$matches[1] 为第一个括号中的子模式所匹配的字符串组成的数组,以此类推

PREG_SET_ORDER:对结果排序使 $matches[0] 为第一组匹配项的数组,$matches[1] 为第二组匹配项的数组,以此类推

PREG_OFFSET_CAPTURE:如果设定本标记,对每个出现的匹配结果也同时返回其附属的字符串偏移量

下面的例子演示了将文本中所有 <pre></pre> 标签内的关键字(PHP显示为红色。


<?PHP

$str = "<pre>学习PHP是一件快乐的事。</pre><pre>所有的PHPer需要共同努力!</pre>";

$kw = "PHP";

preg_match_all('/<pre>([sS]*?)</pre>/',$str,$mat);

for($i=0;$i<count($mat[0]);$i++){

$mat[0][$i] = $mat[1][$i];

$mat[0][$i] = str_replace($kw,'<span style="color:#ff0000">'.$kw.'</span>',$mat[0][$i]);

$str = str_replace($mat[1][$i],$mat[0][$i],$str);

}

echo $str;

?>

正则匹配中文汉字


正则匹配中文汉字根据页面编码不同而略有区别:


GBK/GB2312编码:[x80-xff>]+ 或 [xa1-xff]+

UTF-8编码:[x{4e00}-x{9fa5}]+/u

例子:


<?PHP

$str = "学习PHP是一件快乐的事。";

preg_match_all("/[x80-xff]+/",$match);

//UTF-8 使用:

//preg_match_all("/[x{4e00}-x{9fa5}]+/u",$match);

print_r($match);

?>

输出


Array

(

[0] => Array

(

[0] => 学习

[1] => 是一件快乐的事。

)

)

原文链接:https://www.f2er.com/regex/360655.html

猜你在找的正则表达式相关文章