我有一个非常大的日志文件,我需要计算特定字符串的所有变体的出现次数;那是:
有大量文件ID以AA000 ####格式显示.我必须找出这个文件中前五或十个ID(哪些ID出现次数最多).
我想这可以用select-string和正则表达式来完成?
如果你想突破标题部分(我猜你做)而不是基于整个URL(可能包含特定于该访问的信息)的分组,你需要得到title参数的值,如下所示:
get-content "test.txt" | % {if($_ -match 'title=([^\&]+)') {$($Matches[1])}} | group | sort -desc Count