在本地运行awk版本的phylomatic-awk利用植物名录生成进化树
2022-03-31 12:00:00
在本地运行awk版本的phylomatic-awk利用植物名录生成进化树
Phylomatic网页版在2021年下线后,Cam Webb提供了phylomatic-awk (https://github.com/camwebb/phylomatic-awk)。可先下载zip包到本地,保存为phylomatic-awk-main.zip。
该软件是用awk语言写成的,在安装了awk解释器的计算机上就可以运行。本文以Windows10系统为例,介绍awk版本的phylomatic的运行。
要运行awk版本的phylomatic,当然要先安装awk的解释器。rtools和git两个软件,就都内置又awk的解释器,因此,只要系统装了rtools (https://cran.r-project.org/bin/windows/Rtools/)或者git (https://git-scm.com/), 同时将awk添加到电脑的启动路径(也就是将awk.exe添加到系统路径中,以便于从cmd调用),就可以在本地运行phylomatic了。
在Windows10中具体添加awk.exe到启动路径的方法是:
- 找到gawk.exe的路径,如果安装了git,则路径一般为
C:\Program Files\Git\usr\bin
, 如果安装了rtools,则路径一般为C:\rtools40\usr\bin
- 在桌面找到“我的电脑”,点击鼠标右键,“属性”,点击“高级系统设置”>“环境变量”>“系统变量”>找到 “path”>,点击“编辑”
- 将
C:\Program Files\Git\usr\bin
添加到path中。
方法为:点击“新建”,在最底一行粘贴
C:\Program Files\Git\usr\bin
- 测试gawk.exe是否添加成功:
方法为: 回到桌面,右键点击鼠标,点击 git bash
here。然后在新窗口中,输入gawk
,若结果如图所示,则添加成功。
用7zip或者winrar解压缩 phylomatic-awk-main.zip
打开 phylomatic-awk-main 文件夹,鼠标右键点击git bash here 以打开git命令行窗口
- 在命令行窗口输入或者粘贴以下命令:
gawk -f phylomatic --clean --newick data/zanne2014.new --taxa examples/taxa2
按回车。
命令解释如下: - gawk
:
gawk是调用gawk.exe可执行文件,也就是awk语言的解释器。 -
-f phylomatic
表示要运行的awk脚本名为 phylomatic。 -
--clean
表示要获得的进化树是
clean的,不要有内部不必要的节点。 -
--newick data/zanne2014.new
:
表示进化树骨架的文件为data/zanne2014.new
。 -
--taxa examples/taxa2
:
表示科、属、种列表的位置为examples/taxa2
结果显示如下:
图中,黄色的为路径,在鼠标右键打开就好。 以$符号开始的行为输入的命令。
要想将结果保存到文本文件中,需要输入如下命令:
gawk -f phylomatic --clean --newick data/zanne2014.new --taxa examples/taxa2>tree.txt
结果如下:
>
符号的意思是将运行结果保存在tree.txt
文件中。
上面就是用awk版本的phylomatic生成进化树的过程。
除了awk版本的phylomatic,要用科属种名录生成进化树,也可以用v.phylomaker R程序包,具体参见:
用李代江博士的rtrees程序包也可以根据物种名录生成进化树: - https://github.com/daijiang/rtrees