r - 具有异构变量的客户集的聚类-6ren

r - 具有异构变量的客户集的聚类

转载作者：行者123 更新时间：2023-11-30 09:47:35

24

4

我有一组具有不同属性的客户，连续属性、分类属性、二元属性和序数属性。知道我们不能对这些不同类型的属性应用相同的距离度量，我如何对它们进行聚类？预先感谢您

最佳答案

正如已经提到的，daisy 包是一个选项，它可以根据数据类型自动选择最佳距离度量。但我建议采用以下方法并请求专家插话。

而不是自动选择识别并删除一些相关变量，例如(一些示例)
PIL 逊相关性:对于连续变量
卡方检验:用于分类变量分类与数值:单向方差分析测试等。

采用有用变量的子集，考虑对 calcategories 变量进行 One-Hot 编码，并可能将序数转换为连续(或分类和 one-hot 编码)。使用不同的距离度量(如欧几里德、曼哈顿等)进行测试来评估结果。通过这种方式，您可以更清楚地了解整个聚类过程。

关于r - 具有异构变量的客户集的聚类，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50406387/

24

4

0

文章推荐： java - 如何使用JPMML-Android实现PMML机器学习模型？

objective-c - 异构 NSTreeController
我有一个 NSTreeController (向 NSOutlineView 提供内容)。我希望顶级对象属于一个类，而所有其他对象(因此，任何级别的子对象)属于另一个类。解决这个问题的最佳方法是什么？
haskell - 异构 GADT 列表
我有一个如下所示的 GADT data MyTypes = MyInt | MyDouble data Test (t :: MyTypes) where A :: Int -
python - 异构 numpy 数组上的数组操作
我需要一个高效的异构数组，其中第一个元素是 int，其余是 float。然而，创建它之后，基本的数组操作就会呈爆炸式增长。 A = np.zeros(1, dtype='i4, f4, f4') B
python - 异构 DataFrame 上的 StratifiedKfold
我有一个 pandas DataFrame，其中包含需要拆分成平衡切片的字符串和浮点列，以便训练 sklearn 管道。理想情况下，我会使用 StratifiedKFold在 DataFrame 上
异构 POD 类型的 C++ 容器
是否有一种异构容器的形式，能够存储例如不同的基本类型(例如int、float、double)? 最终我希望能够在计算中使用元素而无需显式引用类型，例如 auto res = a + b，其中操作数 a
c++ - 一组(异构) vector 的 Push_back 实现
假设我有一个结构(或类)，如下所示: struct _particle { std::vector vx , vy; std::vector id; std::vector rx, ry; }; ty
scala - Slick 2.10-RC1，Scala 2.11.x，使用 case 类绕过 22 arity 限制(异构)
我在将具有 > 22 列的表专门映射到 case class 时遇到问题，假设您有以下代码 import slick.driver.PostgresDriver import scala.slick.

首页

博学

6Ren·AI

商城

r - 具有异构变量的客户集的聚类