我注意到我的Ruby(1.9)脚本中存在一些极端延迟,经过一些挖掘后,它归结为正则表达式匹配。我在Perl和Ruby中使用以下测试脚本:
Perl的:
$fname = shift(@ARGV); open(FILE,"<$fname" ); while (<FILE>) { if ( /(.*?) \|.*?SENDING REQUEST.*?TID=(.*?),/ ) { print "$1: $2\n"; } }
红宝石:
f = File.open( ARGV.shift ) while ( line = f.gets ) if /(.*?) \|.*?SENDING REQUEST.*?TID=(.*?),/.match(line) puts "#{$1}: #{$2}" end end
我对两个脚本使用相同的输入,一个只有44290行的文件。
每个人的时间安排是:
Perl的:
xenofon@cpm:~/bin/local/project$ time ./try.pl input >/dev/null real 0m0.049s user 0m0.040s sys 0m0.000s
红宝石:
xenofon@cpm:~/bin/local/project$ time ./try.rb input >/dev/null real 1m5.106s user 1m4.910s sys 0m0.010s
我想我正在做一些非常愚蠢的事情,有什么建议吗?
谢谢
regex = Regexp.new(/(.*?) \|.*?SENDING REQUEST.*?TID=(.*?),/) f = File.open( ARGV.shift ).each do |line| if regex .match(line) puts "#{$1}: #{$2}" end end
要么
regex = Regexp.new(/(.*?) \|.*?SENDING REQUEST.*?TID=(.*?),/) f = File.open( ARGV.shift ) f.each_line do |line| if regex.match(line) puts "#{$1}: #{$2}" end