gpt4 book ai didi

r - R 中的 Bray-Curtis 成对分析

转载 作者:行者123 更新时间:2023-12-02 19:41:23 26 4
gpt4 key购买 nike

我正在尝试使用 R 中的 Vegan 包来计算和可视化配对/合并站点的社区之间的 Bray-Curtis 差异。

下面是一个简化的示例数据框:

Site = c("A", "B", "C", "D", "E", "F", "G", "H", "I", "J") 

PoolNumber = c(1, 3, 4, 2, 4, 1, 2, 3, 4, 4)

Sp1 = c(3, 10, 7, 0, 12, 9, 4, 0, 4, 3)

Sp2 = c(2, 1, 17, 1, 2, 9, 3, 1, 6, 7)

Sp3 = c(5, 12, 6, 10, 2, 4, 0, 1, 3, 3)

Sp4 = c(9, 6, 4, 8, 13, 5, 2, 20, 13, 3)

df = data.frame(Site, PoolNumber, Sp1, Sp2, Sp3, Sp4)

“Site”是一个变量,指示每个样本的采集位置“Sp”列表示每个地点物种的丰度值。我想比较具有相同“PoolNumber”的网站对,并为每次比较获取一个相异值。

大多数示例建议我应该创建一个仅包含“Sp”列的矩阵并使用以下代码:

matrix <- df[,3:6]

braycurtis = vegdist(matrix, "bray")

hist(braycurtis)

但是,如果我消除带有“PoolNumber”和“Site”的列,我不确定如何告诉 R 要比较哪些行。这是否涉及按“PoolNumber”进行组织,使用它作为行名称,然后编写一个循环来比较每两行?我还发现输出很难解释。较低的 Bray-Curtis 值表示更相似的社区(更接近 0 的值),而更高的值(更接近 1)表示更不相似的社区,但是有没有办法告诉方向性,哪一个更多样化?

我是一名 R 初学者用户,对于任何术语/格式的误用,我深表歉意。感谢所有建议。

谢谢

最佳答案

您的意思是您想要获得具有相同 PoolNumber 的差异子集吗? vegdist 函数将为您提供所有差异,您可以从中选择您的配对。当您首先将相异性转换为对称矩阵,然后从该对称矩阵中选择子集时,这是最简单的:

braycurtis <- vegdist(df[,3:6])
as.matrix(braycurtis)[df$PoolNumber==4,df$PoolNumber==4]
as.dist(as.matrix(braycurtis)[df$PoolNumber==4,df$PoolNumber==4])

如果您只想得到平均值,vegan::meandist 函数将为您提供:

meandist(braycurtis, df$PoolNumber)

此处的对角线值将是 PoolNumber 内的平均差异以及不同 PoolNumber 之间的非对角线平均差异。查看 vegan::meandist 的代码,您可以看到这是如何完成的。

布雷-柯蒂斯差异(像所有正常的差异一样)是一种对称度量,它不了解多样性的概念。您可以评估每个站点的多样性程度,但您需要首先告诉我们“多样性”是什么意思(多样性还是其他?)。然后您只需在计算中使用这些值即可。

如果您只想查看项目(物种)的数量,以下函数将为您提供下三角的差异(并且上三角的值将与符号切换相同):

designdist(df[,3:6], "A-B", "binary")

或者,您可以使用逐行统计数据并查看它们的差异。这是 Shannon-Weaver 多样性指数的示例:

H <- diversity(df[,3:6])
outer(H, H, "-")

要获取子集,请按照与 Bray-Curtis 索引类似的方式进行操作。

关于r - R 中的 Bray-Curtis 成对分析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51200770/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com