gpt4 book ai didi

algorithm - 分离和模式匹配技术

转载 作者:塔克拉玛干 更新时间:2023-11-03 02:45:41 24 4
gpt4 key购买 nike

我是人工神经网络的新手。

我对这样的应用感兴趣:

table

我有大量对象。每个对象都有六个属性,用 P1-P6 表示。每个属性都有一个值,它是一个符号值。换句话说,在我的示例中,P1–P6 可以具有来自集合 {A、B、C、D、E、F} 的值。它们不是数字。 (假设A、B、C、D、E、F是颜色,那么你就会明白我的想法了。)

现在,还有一个我感兴趣的属性 R。假设

R = {G1, G2, G3, G4, G5}

我需要为大量 P1–P6 和相关 R 训练一个系统。现在我想执行以下操作。

  1. I have an object and I know the values of P1 to P6. I need to find the R (The Group that the object belongs.)

  2. To get a desired R what is the pattern I need to have in P1–P6. As an example given that R = G2 I need to figure out any pattern in P1–P6.

我的问题是:

  1. What are the theories/technologies/techniques I should read and learn in order to implement 1 and 2, respectively?

  2. What are the tools/libraries you can recommend to get this simulated/implemented/tested?

最佳答案

按照您描述问题的方式,您需要查找各种机器学习技术。如果是我,我会尝试阅读有关 k-NN(k 最近邻)的分类。当我说分类时,我的意思是如果你知道 P1-P6 就得到 R。这是一项非常简单的技术,在这里应该会有帮助。

至于反过来,您基本上需要的是人口的代表性样本。这是我认为不常见的,但你可以尝试像 k-means Clustering 这样的东西。聚类方法通常自行确定对象的类(属性 R),但 k-means 聚类在这种情况下很酷,因为您需要给它对象类的数量(例如 R 的不同可能值),最后你得到一个有代表性的样本。

在我看来,您绝对不应该采用任何非常复杂的技术(如神经网络),因为您的数据没有精确的数值解释,并且无法逐渐解释这些值。

推荐的工具实际上取决于您的基本编程语言。有一个很棒的工具叫做 Orange,它是基于 Python 的,它是我处理这类事情的首选工具(特别是因为它非常容易将 Python 模块与 C/C++ 连接起来)。如果您更喜欢 Java,可以使用名为 Weka 的非常相似的工具。我认为 Weka 的文档稍微好一点,但我不喜欢 Java,所以我从未尝试过。

这两种工具都有一个图形化的可点击界面,您可以在其中加载数据并完成分类、使用参数并检查使用不同技术和不同设置获得的输出类型。一旦你决定你得到了你需要的结果(或者如果你只是不喜欢图形界面),你也可以在编程时将它们都用作一种库(Orange 的 Python 和 Weka 的 Java)并使分类成为一个更大项目的一部分。

如果您浏览 Orange 或 Weka 的文档,我认为它会给您一些想法,让您了解您实际上可以用您拥有的数据做什么,以及您何时知道一些您觉得有趣且适用于数据,也许与仅搜索一般性建议相比,您可以在此处获得更多关于一些特定方法的高质量评论和信息。

关于algorithm - 分离和模式匹配技术,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7306468/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com