问题:
现有若干县的植物标本记录,即每个种在该县境内采集的标本数量,求这些县植物标本采集的完整程度。
解答:
标本采集的完整程度可以用随标本数量增加,物种累计数的快慢表示。
假设A县采集了5000份标本,而这5000份标本总共记录了500个种;B县采集了5000份标本,而这5000份标本包括了2000个种,很显然,A县的标本采集是比较充分的;相比之下,B县就很不充足,因为B县境内,物种数仍然随着标本数快速增加。
那么如何度量物种累计的快慢呢?中科院植物所的阳文静博士(Yang et al. 2013)在度量中国各县植物标本采集完整程度时,采用了物种累计数达到90%时的斜率。也就是计算标本数达到90%-100%时物种累计曲线的平均斜率。该思路简化下来,就是先计算标本数达到90%时对应的物种数,然后取平均值,然后将所有标本数对应的总物种数作为另外一个坐标点,两点确定一条直线,确定这条直线的斜率(原文信息不够详尽,可能本人理解有误)。
另一种思路是计算物种数达到90%时的切线斜率。由于是随机抽样,物种数从<90%到跨越90%的一瞬间,物种数会增加,随机抽样时,物种数会围绕某个值上下波动,因此这里可以计算多次,取平均值。
这里只给出第二种思路的R代码,即求切线的斜率。
图1. 要读取的标本记录格式
\2. 阳文静(Yang et al., 2013)中国各县植物标本采集完整程度
图3 物种数累计曲线:标本采集完整的县斜率小,标本采集不完整的县斜率大
R脚本
1 | setwd("C:/Users/helixcn/Desktop/completeness") |
致谢
- 感谢中科院植物所刘慧圆老师一起讨论问题
参考文献
- Yang, W., Ma, K., & Kreft, H. (2013). Geographical sampling bias in a large distributional database and its effects on species richness-environment models. Journal of Biogeography, 40(8), 1415–1426. https://doi.org/10.1111/jbi.12108