转载自:http://www.caiguai.net/thread-21-1-1.html
今天在写通用采集类的时候,需要用到正则处理一些匹配,比较常用的当然就是preg_match_all了,以前也经常使用它来进行正则的匹配。刚在查看preg_match_all的手册的时候,注意到原来preg_match_all有一个PREG_SET_ORDER的参数,是用于设置匹配后返回的数组的顺序。
- int preg_match_all ( string pattern,string subject,array matches [,int flags] )
参数flags为以下3个:PREG_PATTERN_ORDER PREG_SET_ORDER PREG_OFFSET_CAPTURE 其中PREG_PATTERN_ORDER为默认参数。
我们用例子来看看PREG_PATTERN_ORDER和PREG_SET_ORDER的区别。
- Array
- (
- [0] => Array
- (
- [0] => <a href="http://www.baidu.com/">百度</a>
- [1] => <a href="http://www.google.com/">谷歌</a>
- [2] => <a href="http://www.caiguai.net/">怪手论坛</a>
- )
- [1] => Array
- [0] => http://www.baidu.com/
- [1] => http://www.google.com/
- [2] => http://www.caiguai.net/
- [2] => Array
- [0] => 百度
- [1] => 谷歌
- [2] => 怪手论坛
- )
- [1] => http://www.baidu.com/
- [2] => 百度
- [0] => <a href="http://www.google.com/">谷歌</a>
- [2] => 谷歌
- [0] => <a href="http://www.caiguai.net/">怪手论坛</a>
- [1] => http://www.caiguai.net/
- 而根据我之前阅读别人代码,就一直认为应该这么来组合结果:
- foreach ($matches_set as $v) {
- echo '链接:'.$v[1];
- echo '网址:'.$v[2];
- */
- 通过阅读一些优秀的源代码,可以汲取到很多先进的思想和接触一些函数和方法的独特用法,但是由于初印象很重要,如果开始的时候接触到的是一些不全或者不足的代码,久而久之你用习惯以后,就很难发现它存在的问题,甚至认为这就应该是这样。当初我也自问过,为什么preg_match_all的匹配结果不能按照上面第二种方式组合呢?甚至我还曾写过一个函数来重新组合这个结果为第二种数据结果。PHP手册很重要,它是PHP的官方支持文档、是一个标准,看来以后要多阅读才行。谨以此为戒!
- foreach ($matches_set as $v) {