在实际应用中,尤其是sequence数据,应该尽可能避免把整个文件读入内存,文件有可能几个G甚至更大,可能引起内存崩溃。应该放在数据库里,建索引以检索数据。Bioperl有一个module, Bio::DB::Fasta可以实现这个,这个模块在没有安装bioperl的情况下也可以单独安装使用。

Continue reading

Author's picture

Guangchuang Yu

Bioinformatics Professor @ SMU

Bioinformatics Professor

Guangzhou