对不起,如果这太基础了我有一个csv文件,其中列有一个标题行(v1,v2等)。我明白要提取第1列和第2列,我必须做:awk -F“,”{print $ 1“,”$ 2}’infile.csv> outfile.csv。但是,如果我必须提取1〜10,20〜25,30,33列,怎么办?作为附录,是否有任何方式直接使用标题名称而不是列号?
我不知道是否可以在awk中做范围。你可以做一个for循环,但你不得不添加处理来筛选你不想要的列。这可能更容易做到这一点:
awk -F,'{OFS=",";print $1,$2,$3,$4,$5,$6,$7,$8,$9,$10,$20,$21,$22,$23,$24,$25,$30,$33}' infile.csv > outfile.csv
还有别的考虑 – 而且这个更快更简洁:
cut -d "," -f1-10,20-25,30-33 infile.csv > outfile.csv
至于您的问题的第二部分,我可能会在perl中编写一个脚本,该脚本知道如何处理标题行,从stdin或文件中解析列名称,然后进行过滤。这可能是我想要的其他东西的工具。我不知道在一个班轮上做什么,虽然我相信可以做到。