IP地址有4段组成,每一段数字的范围为0~255,在一段文本中提取ip地址可以这样
$src = 'src = alsdlk ks sdf2.3.3.4 234.193.1.120.1232 d.233.43.23.34 23.34.23.33 dfkl lksd\flk \lkjs.c lksf.c \ kldslfj.c lkdslkf.c lkkldsf.c'; $src =~ m/((?<![\w.])\b(([01]?\d\d?|2[0-4]\d|25[0-5])\.){3}([01]?\d\d?|2[0-4]\d|25[0-5]))\b(?![\w.])/; print "1: ".$1."\n"; print "2: ".$2."\n"; print "3: ".$3."\n"; print "4: ".$4."\n";效果为:
1: 23.34.23.33 2: 23. 3: 23 4: 33使用语言为perl
注:该正则表达式被分成四部分
第一部分:是一个环视,表示在\b(单词的开始符号)前不能有的字符,即在\b前不能有点号“.”或字母
第二部分:是三个选择分支,第一个匹配是的0~199的范围,第二个分支匹配200~249的范围,
第三个匹配250~255的范围,在后面有一个{3},表示连续出现3个这样的字符串
第三部分跟第二部分一样,只是匹配没有点号“.”
第四部分用了一个环视:表示在\b(单词结束符号)后不应该出现点号"."或字母
注意:环视不会捕获字符串,即不会存储在$x中的