将比对好的fasta序列转换成relaxed phylip格式

在推断进化树的过程中,我们有时候希望phylip格式的文件能够将序列名称完整保留下来。这里就需要用relaxed phylip格式。

不过,通常情况下,如果序列名超过10字符,ClustalX和MUSCLE等软件给出的phylip文件会将名称截取到十个字符,也就是遵循传统的PHYLIP格式。

为了将比对好的FASTA文件直接转换为 relaxed phylip格式的文件, 这里提供了R的源代码。供有兴趣的同仁参考。

请参考最新版本的 phylotools 程序包

1
2
3
4
5
library(devtools)
install_github("helixcn/phylotools")
library(phylotools)
dat <- read.fasta("aligned_fasta.fasta")
dat2phylip(dat, outfile = "out.phy")