gpt4 book ai didi

python - 有没有办法根据 pandas DataFrame 中的类别查找模式?

转载 作者:行者123 更新时间:2023-12-01 02:03:59 26 4
gpt4 key购买 nike

我想知道是否有一种方法可以根据类别在 pandas DataFrame 中查找模式。

我知道 kmeans 适用于数值,但我的数据框主要由类别和日期组成:

car   check   jobcard   date        season 
merc A 12A 01-01-2010 Winter
bmw B 45A 03-02-2010 Winter
merc A 12D 10-01-2010 Winter
bmw C 25C 01-05-2010 Spring
vw A 62B 01-08-2010 Summer
etc

它持续了大约 5000 行,数据集代表了检查后需要维修的不同类型的检查,我希望看到一种模式,例如宝马主要在夏天出现问题,或者 12A 工作卡从来没有发生在冬天。我已经制作了一些散点图,但我无法从中获得任何结果:Scatterplot

enter image description here

是否有任何软件包可以提供更好的概述,或者可以像 kmeans 对数值那样对类别进行聚类?

最佳答案

k-means 有一种变体,称为 k-modes,已在此处发布

http://www.cs.ust.hk/~qyang/Teaching/537/Papers/huang98extensions.pdf

这适用于分类数据。

请注意,您获得的解决方案对初始条件敏感,如此处所述

https://arxiv.org/ftp/cs/papers/0603/0603120.pdf

请参阅Pythonic实现

http://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html

关于python - 有没有办法根据 pandas DataFrame 中的类别查找模式?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49254559/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com