gpt4 book ai didi

用于寻找特殊特征的 R/机器学习算法?

转载 作者:行者123 更新时间:2023-11-30 09:04:25 25 4
gpt4 key购买 nike

同事给我分配了一个问题,但我很难想出可能的解决方案。问题是:我有一个数据集,其中每一行代表我们在这里生产的一件产品,列代表生产过程中发生的许多不同因素的值(例如长度、重量、温度等)。现在,有时会出现某种产品存在严重缺陷,无法销售给客户的情况。由于我们不知道为什么会出现这些缺陷,因此我们想要查看此数据集并使用 R 中的机器学习算法来找出有缺陷的产品是否有任何不同或不寻常的地方(例如温度远高于平均水平等)上)。

我想我要问的是,如果有某种类型的方法、算法或研究,任何人都可以指出我,以便我可以获得更多有关此的信息。非常感谢您的帮助!

最佳答案

有许多不同的方法可能适合您的需求。例如,如果您有相应标记的缺陷示例,您可以尝试使用标准机器学习算法(SVM、朴素贝叶斯、随机森林等)进行简单的二元分类。

尽管在您的情况下,异常检测算法似乎可能更明确。这里的想法是训练分类器来检测一类示例(“正常”类),并且它无法检测到的所有内容都可能是您的案例中产品的异常或缺陷。您可以使用在 caret 中实现的 SVM 查看一类分类(查看类似的问题,例如 One-class classification with SVM in R )。您可以尝试的另一种算法是用于异常检测的自动编码器(如 Predicting Fraud with Autoencoders and Keras 中所述)。这是假设自动编码器中缺陷示例的重构误差将高于非缺陷示例。

如果我处于您的立场,我会尝试这些异常检测算法,因为它们似乎符合您对问题的描述。

干杯:)

关于用于寻找特殊特征的 R/机器学习算法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56220184/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com