python - 如何在机器学习前诊断中看到完全相同的特征-6ren

python - 如何在机器学习前诊断中看到完全相同的特征

转载作者：太空宇宙更新时间：2023-11-03 14:38:36

25

4

我想看看，我的数据是否可以达到高精度，或者不是基于完全相同的特征(不是目标变量)，这是我的数据:

X1 X2 X3 X4 y
2  3  4  5  1
5  2  3  2  0
2  3  4  5  1
5  2  2  2  0
4  3  2  5  1
2  3  4  5  0
5  2  2  2  0

我想看到的是

X1 X2 X3 X4 y
2  3  4  5  1
2  3  4  5  1
2  3  4  5  0
5  2  2  2  0
5  2  2  2  0

所以我可以对这个完全相同的特征进行诊断，有什么建议吗？

最佳答案

您想使用pd.DataFrame.duplicated 。包含参数 keep=False 以便识别所有具有重复项的行。

df[df.drop('y', 1).duplicated(keep=False)]

   X1  X2  X3  X4  y
0   2   3   4   5  1
2   2   3   4   5  1
3   5   2   2   2  0
5   2   3   4   5  0
6   5   2   2   2  0

请注意，我 drop('y', 1) 是为了删除 'y' 列。这样做的目的是将重复的评估限制为非 'y' 列。我们还可以使用duplicated 的subset 参数。

df[df.duplicated(['X1', 'X2', 'X3', 'X4'], keep=False)]

   X1  X2  X3  X4  y
0   2   3   4   5  1
2   2   3   4   5  1
3   5   2   2   2  0
5   2   3   4   5  0
6   5   2   2   2  0

关于python - 如何在机器学习前诊断中看到完全相同的特征，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46722369/

25

4

0

文章推荐： python - 如何增加最大查询时间？

文章推荐： c# - 无法在 Android 9,10 Xamarin 上获得媒体播放器声音

文章推荐： c# - 如何统一检查两个 tilemap 之间的碰撞？

.net - 诊断 MissingMethodException
当我在一台机器上启动我的应用程序时，它立即退出说它已经“停止工作”。在事件日志中，我看到 MissingMethodException 是原因。没有显示异常对话框，并且在事件日志详细信息中我看不到任何
azure - 诊断 MobileServiceInvalidOperationException
我正在从 Windows Phone 8 模拟器调用 Azure 移动服务。有时我会收到没有 InnerException 属性的 MobileServiceInvalidOperationExcep
azure - 无法加载功能.诊断
我正在创建一个 Web 客户端，用于使用 ACS Calling SDK 加入 Teams session 。我在加载诊断 API 时遇到问题。 Microsoft 提供了此页面: https://l
linux - 诊断:应用程序被用户杀死
知道为什么我的应用程序被杀死吗？我是该节点的唯一用户。我的历史记录服务器也没有显示任何内容。我如何进一步追踪并了解是谁杀死了它，以及为什么以及如何修复它？ ubuntu@anmol-vm1-new:
azure - 无法加载功能.诊断
我正在创建一个 Web 客户端，用于使用 ACS Calling SDK 加入 Teams session 。我在加载诊断 API 时遇到问题。 Microsoft 提供了此页面: https://l
Azure 诊断 - 如何获取性能计数器原始数据
我正在寻找一种从 Windows Azure 中的性能计数器获取原始数据的方法使用诊断 API。到目前为止，我注意到我可以从已知的计数器中配置一个计数器并设置该计数器的采样率。诊断配置中配置的
azure - 诊断/日志存储表在哪里？
我在将 WebRole(WCF 服务)部署到 Azure 时遇到问题。我的 WebRole 持续显示忙碌状态至少 30 分钟，直到我中止它。我通过 Visual Studio 2010 进行部署。我正
clang - 是否有只是一个注释的 Clang 诊断？
Clang has several kinds of diagnostics ，其中三种主要是错误、警告和注释。注释通常伴随着某些警告和错误，例如重复定义: error: conflicting t
winapi - 诊断 Win32 程序中的死锁
调试由于 Win32 生产过程中的死锁而导致的明显挂起的步骤和技术是什么。我听说 WinDbg 可用于此目的，但您能否提供有关如何实现此目的的明确提示？最佳答案此 post应该让您开始使用各种选项
azure - 检索 Azure 诊断
我有一个在 Azure 上运行的应用程序，它会记录(实际上是跟踪)到 Azure 诊断存储。我正在寻找一个可以用来分析这些日志的好工具。我知道可以使用 Visual Studio 中的服务器资源管理
profiling - 诊断 Bazel 缓慢的步骤
我在当前项目中使用 Bazel 经历了很长的“干净构建”时间。我们推荐的诊断步骤是什么？最佳答案尝试使用 --profile 分析您的构建语法为 bazel build --profile f
gcc - 区分 gcc 诊断
我在解释 gcc (4.8.2) 警告和错误时遇到问题。更准确地说，很难分辨一个问题在哪里结束，另一个问题从哪里开始。我只能通过控制台访问构建机器，因此不能选择使用 IDE。我真的需要能够快速区分个
azure - 如何在云服务中启用 Azure 诊断
我想为我的 azure 云服务启用 azure 诊断，但我有点困惑。我读了这篇文章:https://learn.microsoft.com/en-us/azure/cloud-services/cl
c# - 诊断/调试潜在的堆栈损坏.NET应用程序
我想我这里有个卷曲的地方...我有一个WinForms应用程序，当它作为x64进程运行时，它每小时大约会定期崩溃。我怀疑这是由于堆栈损坏引起的，并且想知道是否有人看到过类似的问题，或者是否有诊断和检测
azure - 是否应该为生产部署启用 Azure 诊断？
我正在研究 Azure Web 角色的性能改进，并想知道在发布/部署到生产站点时是否应保留诊断。 This article说要禁用它，但其中一条评论说您会丢失关键数据。最佳答案您绝对应该启用它。一
azure - 是否可以在不使用托管服务的情况下使用 Azure 诊断
我的解决方案中有多个 Web 和辅助角色，但我还有一个在 Azure 托管 VM 上运行的非 Azure 应用程序。该应用程序连接到 Azure 存储以执行各种操作，例如读取和写入 blob 和队列，
azure - 诊断 Azure 有状态参与者
我仍在努力理清思路 Azure Service Fabric Stateful Actors 。因此，我的(当前)问题最好放入这样的示例中: 我有一个帮助台系统，其中每张票证都是一个有状态的参与者。参
profiling - 诊断 CUDA 内核问题
CUDA 到处都有大量文档和指南，但我找不到任何形式的说明来指导如何诊断编译但收到神秘、模糊错误消息(例如“未指定启动”)的内核“这些 block /网格结构有意义吗？”等等我可以以某种方式拦截cu
azure - 诊断 azure 事件网格中的故障？
我没有找到太多解决 azure 事件网格中事件丢失场景的方法。因此我提出与以下场景相关的问题: 我们的代码将事件发布到域。事件将传送到订阅中配置的网络 Hook 。这在一段时间内有效。消费者(
elasticsearch - 诊断 Elasticsearch 问题的最佳方法？
这个问题有点宽泛，但我觉得没有一个地方可以帮助系统地诊断 Elasticsearch 问题。广泛的类别可能是: 客户查询错误查询结果不正确无法解释的行为服务器设置问题性能问题严重错误无

首页

博学

6Ren·AI

商城

python - 如何在机器学习前诊断中看到完全相同的特征