- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我有一个 Pandas DataFrame,它有 2 列:一列用于类别 (PROBLEM_TYPE),一列用于类别描述。显然,每个类别的描述值计数都不同,但由于我计划基于此 DataFrame 训练模型,因此我尝试为每个类别设置相同的值计数。这样我的模型就会更加准确。
数据框:
filtered_df.head()
PROBLEM_TYPE DESCRIPTION
0 problem_type1 blabla...
1 problem_type1 blablablabla...
2 problem_type3 bla...
3 problem_type7 blablabloblo...
4 problem_type2 blobloble...
这是我调用 value_counts()
函数时得到的结果:
filtered_df["PROBLEM_TYPE"].value_counts()
problem_type1 141887
problem_type2 21663
problem_type3 19349
problem_type4 15710
problem_type5 5229
problem_type6 5161
problem_type7 4682
problem_type8 3672
problem_type9 3296
problem_type10 3131
Name: PROBLEM_TYPE, dtype: int64
正如您所看到的,有 10 种不同的问题类型(类别),每种问题都有不同的值计数。我的问题是如何为所有问题类型设置相同的值计数。例如,每个问题类型在 DataFrame 中都具有最小值计数(即 3131)。
换句话说,如何将每个类别的频率设置为相同,以便下次运行 value_counts()
函数时,它看起来像这样:
filtered_df["PROBLEM_TYPE"].value_counts()
problem_type1 3131
problem_type2 3131
problem_type3 3131
problem_type4 3131
problem_type5 3131
problem_type6 3131
problem_type7 3131
problem_type8 3131
problem_type9 3131
problem_type10 3131
Name: PROBLEM_TYPE, dtype: int64
提前致谢。
最佳答案
您可以执行以下操作:
mi = df["PROBLEM_TYPE"].value_counts().min()
df_filtered = df.sample(frac=1).groupby("PROBLEM_TYPE").head(mi)
此解决方案有两个步骤,找到数量最少的“PROBLEM_TYPE”
:
mi = df["PROBLEM_TYPE"].value_counts().min()
然后打乱数据帧行并获取每组的第一个 mi:
df_filtered = df.sample(frac=1).groupby("PROBLEM_TYPE").head(mi)
参见here有关如何打乱数据帧的讨论。
关于python - 如何为 Pandas DataFrame 中找到的所有唯一值设置相同的频率?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58382798/
例如,我有一个父类Author: class Author { String name static hasMany = [ fiction: Book,
代码如下: dojo.query(subNav.navClass).forEach(function(node, index, arr){ if(dojo.style(node, 'd
我有一个带有 Id 和姓名的学生表和一个带有 Id 和 friend Id 的 Friends 表。我想加入这两个表并找到学生的 friend 。 例如,Ashley 的 friend 是 Saman
我通过互联网浏览,但仍未找到问题的答案。应该很容易: class Parent { String name Child child } 当我有一个 child 对象时,如何获得它的 paren
我正在尝试创建一个以 Firebase 作为我的后端的社交应用。现在我正面临如何(在哪里?)找到 friend 功能的问题。 我有每个用户的邮件地址。 我可以访问用户的电话也预订。 在传统的后端中,我
我主要想澄清以下几点: 1。有人告诉我,在 iOS 5 及以下版本中,如果您使用 Game Center 设置多人游戏,则“查找 Facebook 好友”(如与好友争夺战)的功能不是内置的,因此您需要
关于redis docker镜像ENTRYPOINT脚本 docker-entrypoint.sh : #!/bin/sh set -e # first arg is `-f` or `--some-
我是一名优秀的程序员,十分优秀!