如何在awk或sed中用哈希值(如MD5)替换列?
原始文件非常庞大,所以我需要这个非常有效.
所以,你真的不想用awk这样做.任何流行的高级脚本语言 – Perl,Python,Ruby等 – 都会以更简单,更健壮的方式实现.话虽如此,这样的事情会起作用.
给出这样的输入:
this is a test
(例如,有四列的行),我们可以用它的md5校验和替换给定列,如下所示:
awk '{ tmp="echo " $2 " | openssl md5 | cut -f2 -d\" \"" tmp | getline cksum $2=cksum print }' < sample
这依赖于GNU awk(你可能在Linux系统上默认使用它),它使用openssl生成md5校验和.我们首先在tmp中构建一个shell命令行,将选定的列传递给md5命令.然后我们将输出管道输入到cksum变量中,并用校验和替换第2列.鉴于上面的示例输入,此awk脚本的输出将是:
this 7e1b6dbfa824d5d114e96981cededd00 a test