前端之家收集整理的这篇文章主要介绍了
python – 快速找到两个大文本文件之间的差异,
前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我有两个3GB的文本
文件,每个
文件大约有8000万行.并且它们共享99.9%相同的行(
文件A有6万个独特的行,
文件B有8万个独特的行).
如何在两个文件中快速找到这些独特的行?有没有可以使用的命令行工具?我使用Python,但我猜想找到一个有效的Pythonic方法来加载文件和比较是不太可能的.
任何建议是赞赏.
如果顺序重要,请尝试使用comm实用程序.如果顺序不重要,请排序file1 file2 | uniq -u