受中国科学院植物研究所赖江山博士邀请, 本人于2016年5月9日在北京昌平讲解《R编程与进化分析》。
幻灯片如下
PCM_00.pdf
PCM_01.pdf
PCM_02.pdf
PCM_03.pdf
主要内容
- R开发平台的搭建
- R脚本
- R的编程习惯
- 编写R函数
- 程序包的结构
- S3与S4 Methods
- 程序包的安装和检查
- 结合Rcpp编写程序包
- 从github安装程序包
- 使用git记录程序更改, 并更新github
正则表达式与基本文本处理
- gsub
- grepl
- %in%
- regexpr
- gregexpr
极大似然以及贝叶斯的基本原理
- 用极大似然法估计线性模型的参数
- 用MCMCMC估计现行模型的参数
- Bootstrap的原理以及应用
- Permutation的基本原理
进化树基础
- fasta文件
- Phylip文件
- Newick文件
- Nexus文件
DNA Barcoding 序列构建进化树
- fasta文件
- 用MUSCLE进行Alignment
- 用phylotools生成supermatrix (relaxed phylip文件)
- 用RAxML构建极大似然进化树
- 用r8s进行分子钟校订
基于植物名录建立进化树
- 植物名录
- 用plantlist程序包生成科属种列表 (基于APGIII)
- 用科属种列表提交到Phylomatic, 基于Zanne2014进化树生成种水平的进化树
进化树在R中的操作
CRAN Task Views: Phylogenetics
Figtree显示进化树
ggtree: 进化树绘图
ape程序包简介
(1)phylo类型简介以及提取
(2)绘制进化树
(3)祖先状态重建
(4)ltt plotPicante 群落系统发育, 计算 Faith’ PD, 计算系统发育信号, 计算community phylogenetic structure, PIC, Pybus Gamma
laser: 基于极大似然法对物种分化速率和灭绝速率进行估计 speciation and extinction rate.
geiger: 计算MEDUSA
需要安装的软件, 以及用到的软件在 百度盘 (448M), 可以点击以下链接下载
http://pan.baidu.com/s/1geCc9iz
该压缩文件内容如下
- 7z1514-x64.exe*
- basic-miktex-2.9.5872-x64.exe*
- Git-2.7.2-32-bit_setup.1457942412.exe*
- npp_6.9.1_Installer.1459233531.exe*
- out.txt
- package example/
- phylogenetic/
- R-3.2.5-win.exe*
- Rtools33.exe*
- XnViewMP-win-x64.exe*
- 安装指南.txt