我有两个csv文件,我想使用键值(城市列)加入它们.
一个csv文件,d01.csv有这种形式,
Barcelona,19.5,29.5 Tarragona,20.4,31.5 Girona,17.2,32.5 Lleida,16.5,33.5 Vic,17.5,31.4
另一个是d02.csv,具有下一个结构,
City,Data,TMax,TMin Barcelona,20140916,19.9,28.5 Tarragona,21.4,30.5 Lleida,32.5 Tortosa,20.5,30.4
我需要一个新的csv文件,其中一列城市出现在2个csv文件中.
City,Tmin,Tmax,Date,Tmin1,Tmax1 Barcelona,29.5,31.5,30.5 Girona,32.5,33.5,30.4
我试着这样做
join -j 2 -t ',' d01.csv d02.csv | awk -F "," '{print $1,$2,$3,$4,$5} > d03.csv
但它不完整……我怎样才能订购关键值?
以下是如何在bash中使用join:
{ echo "City,Tmax1" join -t,<(sort d01.csv) <(sed 1d d02.csv | sort) } > d03.csv cat d03.csv
City,28.5 Lleida,32.5 Tarragona,30.5
请注意,join仅输出两个文件中密钥存在的记录.要获取所有这些,请指定您希望从两个文件中丢失记录,指定所需的字段,并为缺少的字段提供默认值:
join -t,-a1 -a2 -o 0,1.2,1.3,2.2,2.3,2.4 -e '?' <(sort d01.csv) <(sed 1d d02.csv | sort)
Barcelona,28.5 Girona,?,? Lleida,30.5 Tortosa,30.4 Vic,31.4,?