我有多个列的制表符分隔文件。我想计算文件夹中所有文件的列中不同值的出现频率,并按计数的降序排列(最高计数首先)。我如何在Linux命令行环境中实现这一点?
它可以使用任何常用的命令行语言,如awk,perl,python等。
要查看第二列的频次计数(例如):
awk -F '\t' '{print $2}' * | sort | uniq -c | sort -nr
fileA.txt
z z a a b c w d e
fileB.txt
t r e z d a a g c
fileC.txt
z r a v d c a m c
结果:
3 d 2 r 1 z 1 m 1 g 1 b