我需要处理大文件,必须找到两者之间的差异。而且我不需要不同的位,而是差异的数量。
要找到不同行的数量我想出了
diff --suppress-common-lines --speed-large-files -y File1 File2 | wc -l
它的工作,但有没有更好的方式来做呢?
如何计算确切的差异数(使用标准工具,如bash,diff,awk,sed一些旧版本的perl)?
diff -U 0 file1 file2 | grep -v ^@ | wc -l
那个减2在差异列表的顶部的两个文件名。统一格式可能比并列格式快一点。