多样性指数从公式到实战

在生态学研究中,β多样性指数能够帮助我们了解不同样本之间的微生物群落结构差异。它不同于α多样性指数,因为后者只关注单个样本内物种的丰富度。这次我们来深入探讨一下β多样性指数,从公式到实战。01 β多样性指数是什么? β多样性指数主要是用来衡量不同样本或样本组之间菌群结构的差异。数值越高,说明两个样本的微生物群落组成、物种丰度以及系统进化关系越远。这个概念可以通过多种“距离指数”或者“差异系数”来实现。02 常用β多样性指数速览:2.1 Jaccard距离: Jaccard距离是一种简单而直观的方法,它只关心样本中特有物种的数量。具体来说,它用“交集外的并集”除以“总物种数”来计算。Jaccard距离对物种组成差异最敏感,但它忽略了每个物种的丰度。2.2 Bray-Curtis距离: Bray-Curtis距离考虑到了每个物种的相对丰度。它通过相似系数矩阵直接得出距离值。这个方法更适合比较样本间微生物群落“量”的差异。2.3 UniFrac: UniFrac是一种将系统进化信息嵌入到距离计算中的方法。它有两种形式:加权UniFrac侧重于系统发育距离,并给予稀有物种更多权重;非加权UniFrac先对丰度进行标准化处理,然后再计算进化距离。03 把β多样性指数“降维”到一张图:主坐标分析(PCoA)和非度量多维尺度(NMDS)都可以将高维距离矩阵压缩成二维或三维图形,使样本间的亲疏远近一目了然。图中的点距离与β多样性指数值相关联,点越近则说明两个微生物群落越相似。04 实战:用Phyloseq包一步步算出距离 4.1 导入数据 首先需要设定工作目录,并一次性导入QIIME格式的四个核心文件:OTU表、映射文件、进化树以及参考序列。 4.2 筛选OTU 接着,我们只保留总序列数≥10的OTU,以减少稀疏矩阵带来的噪声。通过读取OTU表中的数据并计算每一列的和得到各个OTU序列数的总和。根据这个总和选择符合要求的OTU进行保留。 4.3 计算并保存距离矩阵 然后,我们可以一次性计算出Jaccard、Bray-Curtis、加权UniFrac和非加权UniFrac四种距离,并将它们存储为CSV格式。 以上就是关于β多样性指数从公式到实战的详细介绍和操作步骤。