一个处理fasta标题的小程序

前端之家收集整理的这篇文章主要介绍了一个处理fasta标题的小程序前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。

问题:有一个fasta文件,其中>后面只有名字,现在要依据另外一个txt文件将附属说明添加到对应名字中。

解决:用perl很方便的可以解决

思路:

1、先打开txt文件,读取关键字和附加说明。

2、再打开fasta文件,将关键字和>后面的名字对比。如果相同就将附加说明添加上去。并将其后面的序列重新写入新的文件中。

这一块用了flag标识。0代表未匹配状态,1代表已经匹配,2代表链接完后面序列。

代码如下:

#!/usr/bin/perl -w
use strict;
my $sourceName="Mortierella_0%_P450_28seq.txt";#关键字+附加txt文件
my $targetName="annotation.fasta";#fasta文件
 
my $flag=0;
open(myFile,$targetName)|| die ("Could not open file");
while(my $myLine = <myFile>){
my @array=split/\t/,$myLine;
 my $keyWord=$array[0];
 my $addtion=$array[1];
 $flag=0;
open(sourceFile,$sourceName)|| die ("Could not open file");
while(my $sourceLine = <sourceFile>){

              if($sourceLine =~/>/ && $flag==0){
              chomp($sourceLine);
                  @array=split/>/,$sourceLine;
                  my $nowWord=$array[1];
                  if($nowWord eq $keyWord)
                  {
                   $flag=1;
                   open(OUTFILE,">>result.fasta")|| die ("Could not open file");
                  print OUTFILE ($sourceLine."\t".$addtion);
                   next;
                  }
              }
              if($flag==1 && !($sourceLine =~/>/)){
              print OUTFILE ($sourceLine);
                      }
                      elsif($flag==1 && $sourceLine =~/>/)
                      {
                       $flag=2;
                      }




}
close(OUTFILE);
close(sourceFile);
}
close(myFile);

猜你在找的Perl相关文章