我正在尝试使用Perl对具有特定字母顺序的名称列表进行排序,以执行一些特殊功能.
排序的工作方式与排序{$a cmp $b}相同,但使用不同的字母序列.
例如,使用任意字符顺序“abdrtwsuiopqe987654”进行排序……
排序的工作方式与排序{$a cmp $b}相同,但使用不同的字母序列.
例如,使用任意字符顺序“abdrtwsuiopqe987654”进行排序……
我尝试处理sort {$a myFunction $b},但我是Perl的新手,我不知道如何正确组织myFunction以获得我想要的东西.
>是否有提供此功能的特定功能(包)?
>你有一个处理字符串的自定义排序函数的例子吗?
>你知道如何(或在哪个源文件中)使用Perl实现的cmp函数来查看它是如何工作的?
解决方法
以下可能是最快的[1]:
sub my_compare($$) { $_[0] =~ tr{abdrtwsuiopqe987654}{abcdefghijklmnopqrs}r cmp $_[1] =~ tr{abdrtwsuiopqe987654}{abcdefghijklmnopqrs}r } my @sorted = sort my_compare @unsorted;
或者如果你想要更动态的东西,以下可能是最快的[2]:
my @syms = split //,'abdrtwsuiopqe987654'; my @map; $map[ord($syms[$_])] = $_ for 0..$#syms; sub my_compare($$) { (pack 'C*',map $map[ord($_)],unpack 'C*',$_[0]) cmp (pack 'C*',$_[1]) } my @sorted = sort my_compare @unsorted;
我们可以逐字逐句地比较,但这会慢得多.
use List::Util qw( min ); my @syms = split //,'abdrtwsuiopqe987654'; my @map; $map[ord($syms[$_])] = $_ for 0..$#syms; sub my_compare($$) { my $l0 = length($_[0]); my $l1 = length($_[1]); for (0..min($l0,$l1)) { my $ch0 = $map[ord(substr($_[0],$_,1))]; my $ch1 = $map[ord(substr($_[1],1))]; return -1 if $ch0 < $ch1; return +1 if $ch0 > $ch1; } return -1 if $l0 < $l1; return +1 if $l0 > $l1; return 0; } my @sorted = sort my_compare @unsorted;
>从技术上讲,使用GRT可以更快地完成.
my @sorted = map /\0(.*)/s,sort map { tr{abdrtwsuiopqe987654}{abcdefghijklmnopqrs}r . "\0" . $_ } @unsorted;
>从技术上讲,sort map { ( pack 'C*',$_ ) . "\0" . $_ } @unsorted;
cmp由scmp运算符实现.
$perl -MO=Concise,-exec -e'$x cmp $y' 1 <0> enter 2 <;> nextstate(main 1 -e:1) v:{ 3 <#> gvsv[*x] s 4 <#> gvsv[*y] s 5 <2> scmp[t3] vK/2 6 <@> leave[1 ref] vKP/REFC
scmp操作符由pp.c
中的pp_scmp函数实现,当使用locale时,它实际上只是sv.c
中sv_cmp_flags的包装器;没有效果. sv_cmp_flags使用C库函数memcmp
或UTF-8识别版本(取决于标量的类型).