在本地运行awk版本的phylomatic-awk利用植物名录生成进化树

在本地运行awk版本的phylomatic-awk利用植物名录生成进化树

Phylomatic网页版在2021年下线后,Cam Webb提供了phylomatic-awk (https://github.com/camwebb/phylomatic-awk)。可先下载zip包到本地,保存为phylomatic-awk-main.zip。

该软件是用awk语言写成的,在安装了awk解释器的计算机上就可以运行。本文以Windows10系统为例,介绍awk版本的phylomatic的运行。

要运行awk版本的phylomatic,当然要先安装awk的解释器。rtools和git两个软件,就都内置又awk的解释器,因此,只要系统装了rtools (https://cran.r-project.org/bin/windows/Rtools/)或者git (https://git-scm.com/), 同时将awk添加到电脑的启动路径(也就是将awk.exe添加到系统路径中,以便于从cmd调用),就可以在本地运行phylomatic了。

在Windows10中具体添加awk.exe到启动路径的方法是:

  1. 找到gawk.exe的路径,如果安装了git,则路径一般为 C:\Program Files\Git\usr\bin, 如果安装了rtools,则路径一般为 C:\rtools40\usr\bin

图1

  1. 在桌面找到“我的电脑”,点击鼠标右键,“属性”,点击“高级系统设置”>“环境变量”>“系统变量”>找到 “path”>,点击“编辑”

图2

图3

图4

  1. C:\Program Files\Git\usr\bin添加到path中。

方法为:点击“新建”,在最底一行粘贴 C:\Program Files\Git\usr\bin

图5

  1. 测试gawk.exe是否添加成功:

方法为: 回到桌面,右键点击鼠标,点击 git bash here。然后在新窗口中,输入gawk,若结果如图所示,则添加成功。

图6

  1. 用7zip或者winrar解压缩 phylomatic-awk-main.zip
  1. 打开 phylomatic-awk-main 文件夹,鼠标右键点击git bash
    here 以打开git命令行窗口

图7

  1. 在命令行窗口输入或者粘贴以下命令:
1
gawk -f phylomatic --clean --newick data/zanne2014.new --taxa examples/taxa2

按回车。

命令解释如下:

  • gawk: gawk是调用gawk.exe可执行文件,也就是awk语言的解释器。
  • -f phylomatic 表示要运行的awk脚本名为 phylomatic。
  • --clean 表示要获得的进化树是 clean的,不要有内部不必要的节点。
  • --newick data/zanne2014.new: 表示进化树骨架的文件为data/zanne2014.new
  • --taxa examples/taxa2: 表示科、属、种列表的位置为examples/taxa2

结果显示如下:

图8

图中,黄色的为路径,在鼠标右键打开就好。 以$符号开始的行为输入的命令。

要想将结果保存到文本文件中,需要输入如下命令:

1
gawk -f phylomatic --clean --newick data/zanne2014.new --taxa examples/taxa2>tree.txt

结果如下:

图9

图10

图11

>符号的意思是将运行结果保存在tree.txt文件中。

上面就是用awk版本的phylomatic生成进化树的过程。

除了awk版本的phylomatic,要用科属种名录生成进化树,也可以用v.phylomaker R程序包,具体参见:

用李代江博士的rtrees程序包也可以根据物种名录生成进化树: