问题:有一个fasta文件,其中>后面只有名字,现在要依据另外一个txt文件将附属说明添加到对应名字中。
思路:
1、先打开txt文件,读取关键字和附加说明。
2、再打开fasta文件,将关键字和>后面的名字对比。如果相同就将附加说明添加上去。并将其后面的序列重新写入新的文件中。
这一块用了flag标识。0代表未匹配状态,1代表已经匹配,2代表链接完后面序列。
代码如下:
#!/usr/bin/perl -w use strict; my $sourceName="Mortierella_0%_P450_28seq.txt";#关键字+附加txt文件 my $targetName="annotation.fasta";#fasta文件
my $flag=0; open(myFile,$targetName)|| die ("Could not open file"); while(my $myLine = <myFile>){ my @array=split/\t/,$myLine; my $keyWord=$array[0]; my $addtion=$array[1]; $flag=0; open(sourceFile,$sourceName)|| die ("Could not open file"); while(my $sourceLine = <sourceFile>){ if($sourceLine =~/>/ && $flag==0){ chomp($sourceLine); @array=split/>/,$sourceLine; my $nowWord=$array[1]; if($nowWord eq $keyWord) { $flag=1; open(OUTFILE,">>result.fasta")|| die ("Could not open file"); print OUTFILE ($sourceLine."\t".$addtion); next; } } if($flag==1 && !($sourceLine =~/>/)){ print OUTFILE ($sourceLine); } elsif($flag==1 && $sourceLine =~/>/) { $flag=2; } } close(OUTFILE); close(sourceFile); } close(myFile);