gpt4 book ai didi

php - 当值有点随机时在 mysql 表中查找相似的项目

转载 作者:行者123 更新时间:2023-11-30 22:11:29 24 4
gpt4 key购买 nike

我有实验室分析结果的数据库。由于分析的性质,结果有点随机——这在现实世界中是正常的。所有结果都以整数形式存储在数据库中(我们以 ppm 为单位保存结果 - 百万分之一)。问题是,我想找到经过多次分析的类似(也许相同) Material 。数据库如下所示:

id  |v1  |v2  |v3  |v4  |... |vn
----|----|----|----|----|----|----
1 |4560|5600|3333| 56| |0
2 |4575|5583|3354| 67| |0
3 |4565|4333|3332| 60| |0
4 | 0|5583|3333| 60| |0

id为1和2的 Material 相同, Material 3和4是唯一的。

我想给公差 +-30 或其他东西来消除结果随机数并找到相同的 Material 。如果每一列的公差值可以是单独的,那就太好了。

为了简化。如何要求 mysql 返回具有值 +- 某个错误值的相似整数?

最佳答案

您真的不想使用 SQL 执行此操作。

本质上,您正在做的是计算 connected components由您的数据库定义的图表,如果两行在您定义的公差范围内,则两行有一条边连接它们。

假设您的数据集足够小以适合内存,这很可能是您实验室进行的样本测试的结果,那么最好的办法是将其全部读入,然后使用合适的库来计算连接的组件.例如,在 Java 中,您可以使用 JGraphT ;如果您需要在 PHP 中执行此操作,那么我相信也有可用的图形库。

在拥有海量数据集的高端,有一些库可以在 Spark 集群上完成...

关于php - 当值有点随机时在 mysql 表中查找相似的项目,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39994690/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com