正则表达式在 PHP 中的应用
PHP 应用中,正则表达式主要用于:•正则匹配:根据正则表达式匹配相应的内容
•正则替换:根据正则表达式匹配内容并替换
•正则分割:根据正则表达式分割字符串
在 PHP 中有两类正则表达式函数,一类是 Perl 兼容正则表达式函数,一类是 POSIX 扩展正则表达式函数。二者差别不大,而且推荐使用Perl 兼容正则表达式函数,因此下文都是以 Perl 兼容正则表达式函数为例子说明。
定界符
Perl 兼容模式的正则表达式函数,其正则表达式需要写在定界符中。任何不是字母、数字或反斜线()的字符都可以作为定界符,通常我们使用 / 作为定界符。具体使用见下面的例子。提示
尽管正则表达式功能非常强大,但如果用普通字符串处理函数能完成的,就尽量不要用正则表达式函数,因为正则表达式效率会低得多。关于普通字符串处理函数。preg_match() 函数用于进行正则表达式匹配,成功返回 1 ,否则返回 0 。
语法:
参数说明:
参数 | 说明 |
---|---|
pattern | 正则表达式 |
subject | 需要匹配检索的对象 |
matches | 可选,存储匹配结果的数组, $matches[0] 将包含与整个模式匹配的文本,$matches[1] 将包含与第一个捕获的括号中的子模式所匹配的文本,以此类推 |
例子 1 :
代码如下:
PHP
if(preg_match("/PHP/i","PHP is the web scripting language of choice.",$matches)){
print "A match was found:". $matches[0];
} else {
print "A match was not found.";
}
?>
if(preg_match("/PHP/i","PHP is the web scripting language of choice.",$matches)){
print "A match was found:". $matches[0];
} else {
print "A match was not found.";
}
?>
浏览器输出:
代码如下:
A match was found: PHP
在该例子中,由于使用了 i 修正符,因此会不区分大小写去文本中匹配 PHP 。
提示
preg_match() 第一次匹配成功后就会停止匹配,如果要实现全部结果的匹配,即搜索到subject结尾处,则需使用 preg_match_all() 函数。例子 2 ,从一个 URL 中取得主机域名 :
代码如下:
PHP
// 从 URL 中取得主机名
preg_match("/^(http://)?([^/]+)/i","//www.jb51.cc/index.html",$matches);
$host = $matches[2];
// 从主机名中取得后面两段
preg_match("/[^./]+.[^./]+$/",$host,$matches);
echo "域名为:{$matches[0]}";
?>
// 从 URL 中取得主机名
preg_match("/^(http://)?([^/]+)/i","//www.jb51.cc/index.html",$matches);
$host = $matches[2];
// 从主机名中取得后面两段
preg_match("/[^./]+.[^./]+$/",$host,$matches);
echo "域名为:{$matches[0]}";
?>
浏览器输出:
代码如下:
域名为:jb51.cc
preg_match_all()
preg_match_all() 函数用于进行正则表达式全局匹配,成功返回整个模式匹配的次数(可能为零),如果出错返回 FALSE 。
语法:
int preg_match_all( string pattern,string subject,array matches [,int flags ] ) 参数说明:
参数 | 说明 |
---|---|
pattern | 正则表达式 |
subject | 需要匹配检索的对象 |
matches | 存储匹配结果的数组 |
flags |
可选,指定匹配结果放入 matches 中的顺序,可供选择的标记有:
|
代码如下:
PHP
$str = "
$kw = "PHP";
preg_match_all('/
for($i=0;$i $mat[0][$i] = $mat[1][$i];
$mat[0][$i] = str_replace($kw,'',$mat[0][$i]);
$str = str_replace($mat[1][$i],$mat[0][$i],$str);
}
echo $str;
?>
$str = "
学习PHP是一件快乐的事。
所有的PHPer需要共同努力!";
$kw = "PHP";
preg_match_all('/
([sS]*?)/',$str,$mat);
for($i=0;$i
$mat[0][$i] = str_replace($kw,'',$mat[0][$i]);
$str = str_replace($mat[1][$i],$mat[0][$i],$str);
}
echo $str;
?>
正则匹配中文汉字
正则匹配中文汉字根据页面编码不同而略有区别:]+ 或 [xa1-xff]+
•UTF-8编码:[x{4e00}-x{9fa5}]+/u
例子:
代码如下:
PHP
$str = "学习PHP是一件快乐的事。";
preg_match_all("/[x80-xff]+/",$match);
//UTF-8 使用:
//preg_match_all("/[x{4e00}-x{9fa5}]+/u",$match);
print_r($match);
?>
$str = "学习PHP是一件快乐的事。";
preg_match_all("/[x80-xff]+/",$match);
//UTF-8 使用:
//preg_match_all("/[x{4e00}-x{9fa5}]+/u",$match);
print_r($match);
?>
输出:
代码如下:
Array
(
[0] => Array
(
[0] => 学习
[1] => 是一件快乐的事。
))
原文链接:https://www.f2er.com/php/25941.html(
[0] => Array
(
[0] => 学习
[1] => 是一件快乐的事。
))