正则表达式 – 如何打印出与grep的唯一匹配数?

前端之家收集整理的这篇文章主要介绍了正则表达式 – 如何打印出与grep的唯一匹配数?前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
假设我有数百万个数据包来查看,我想看到一个数据包发送到某个端口号的次数.

这里有一些包:

10:27:46.227407 IP 85.130.236.26.54156 > 139.91.133.120.60679: tcp 0
10:27:46.337038 IP 211.142.173.14.80 > 139.91.138.125.56163: tcp 0
10:27:46.511241 IP 211.49.224.217.3389 > 139.91.131.47.6973: tcp 0

我想看看这里的第二个端口号:

60679,53163,6973等

所以我可以使用:

grep -c '\.80:' output.txt

计数所有的时间端口80被使用.但是有没有办法显示所有使用的端口,以及在这个文件中找到多少次.像这样的东西,最好排序,我可以看到最常用到哪些端口:

.80: - 54513
.110: - 12334
.445: - 412
请参见 uniq -c.您将要拉出所需的位,排序结果,通过uniq管道,对输出进行排序.这样可能是:
egrep '\.[0-9]+:' output.txt | sort | uniq -c | sort -nr

澄清:我在这里使用了grep,因为你不清楚你的output.txt格式是什么样的,但是你可能要通过cut或者awk来实际删除端口号.

编辑:要获取端口,您可以在一段时间内再次切割一次,然后再次在冒号上:

cut -d. -f10 < output.txt | cut -d: -f1

(或者十几种其他任何方式来完成同样的事情).这将给你一个未排序的端口列表.然后:

cut -d. -f10 < output.txt | cut -d: -f1 | sort | uniq -c | sort -nr

猜你在找的正则表达式相关文章