《R编程与进化分析》幻灯片(2016年5月9日 北京)

受中国科学院植物研究所赖江山博士邀请, 本人于2016年5月9日在北京昌平讲解《R编程与进化分析》。

幻灯片如下

PCM_00.pdf
PCM_01.pdf
PCM_02.pdf
PCM_03.pdf

主要内容

  1. R开发平台的搭建
  2. R脚本
  3. R的编程习惯
  4. 编写R函数
  5. 程序包的结构
  6. S3与S4 Methods
  7. 程序包的安装和检查
  8. 结合Rcpp编写程序包
  9. 从github安装程序包
  10. 使用git记录程序更改, 并更新github

正则表达式与基本文本处理

  1. gsub
  2. grepl
  3. %in%
  4. regexpr
  5. gregexpr

极大似然以及贝叶斯的基本原理

  1. 用极大似然法估计线性模型的参数
  2. 用MCMCMC估计现行模型的参数
  3. Bootstrap的原理以及应用
  4. Permutation的基本原理

进化树基础

  1. fasta文件
  2. Phylip文件
  3. Newick文件
  4. Nexus文件

DNA Barcoding 序列构建进化树

  1. fasta文件
  2. 用MUSCLE进行Alignment
  3. 用phylotools生成supermatrix (relaxed phylip文件)
  4. 用RAxML构建极大似然进化树
  5. 用r8s进行分子钟校订

基于植物名录建立进化树

  1. 植物名录
  2. 用plantlist程序包生成科属种列表 (基于APGIII)
  3. 用科属种列表提交到Phylomatic, 基于Zanne2014进化树生成种水平的进化树

进化树在R中的操作

CRAN Task Views: Phylogenetics

  1. Figtree显示进化树

  2. ggtree: 进化树绘图

  3. ape程序包简介
     (1)phylo类型简介以及提取
     (2)绘制进化树
     (3)祖先状态重建
     (4)ltt plot

  4. Picante 群落系统发育, 计算 Faith’ PD, 计算系统发育信号, 计算community phylogenetic structure, PIC, Pybus Gamma

  5. laser: 基于极大似然法对物种分化速率和灭绝速率进行估计 speciation and extinction rate.

  6. geiger: 计算MEDUSA

需要安装的软件, 以及用到的软件在 百度盘 (448M), 可以点击以下链接下载

http://pan.baidu.com/s/1geCc9iz

该压缩文件内容如下

  1. 7z1514-x64.exe*
  2. basic-miktex-2.9.5872-x64.exe*
  3. Git-2.7.2-32-bit_setup.1457942412.exe*
  4. npp_6.9.1_Installer.1459233531.exe*
  5. out.txt
  6. package example/
  7. phylogenetic/
  8. R-3.2.5-win.exe*
  9. Rtools33.exe*
  10. XnViewMP-win-x64.exe*
  11. 安装指南.txt