- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我正在使用 CreateML 和 Swift 创建表格分类模型。我使用的数据集总共有大约 300 个项目,以及大约 13 个不同的特征。我已经尝试以两种方式训练/测试我的模型,并且得到了非常不同的结果:
1) 从原始完整数据集中随机拆分我的训练和评估数据表:
let (classifierEvaluationTable, classifierTrainingTable) = classifierTable.randomSplit(by: 0.1, seed: 4)
我尝试了 .1 split 数和 4 种子数,但结果各不相同:在某些情况下可能是 33% 或 80% 的评估准确度。 (在这种情况下,我得到了 78% 的训练准确率、83% 的验证准确率、75% 的评估准确率。)
2) 我从原来的数据集中手动取了10个item放到新的数据集中待会测试。然后我从用于训练的 300 项数据集中删除了这些项目。当我测试这 10 个项目时,我得到了 96% 的评估准确率。 (在这种情况下,我得到了 98% 的训练准确率、71% 的验证准确率和 96% 的评估准确率。)
我想知道为什么会有这么大的差异?哪种解读应该被视为更现实可信?我可以对这两种模型做些什么来提高准确性和可信度吗?另外:我对不同的精度测量意味着什么以及我应该如何解释它们(训练、验证、评估)感到困惑?
谢谢。
最佳答案
training/validation accuracy 的含义是,如果后者低于前者,则您的模型过度拟合,即过度适应训练集而无法正确泛化。
所以你的第一个案例产生了好的结果,第二个产生了不好的结果。
当您为模型提供的新(未见)数据在某些方面存在显着差异(这可能可以通过预处理或将其添加到训练集并重新训练模型来解决)时,评估准确性较低。
在第二种情况下,您的模型严重过拟合,并且这 10 个项目是从训练集中取出的,因此它们没有本质上的不同,这显然给了您很高的评估准确性。所以这是一个相当无用的测试。
不清楚第一种情况的评估准确度测试的数据是从哪里得到的。
TL;DR:第一种情况是好的结果,第二种情况是不好的结果。如果对新数据的测试产生的评估准确度太低,则可能是数据在质量上有所不同。
还有一种不同的说法:如果验证准确性低于训练准确性,则您的模型在数量上是错误的(过度拟合);如果您的评估准确性低,则您的模型在质量上很差/不适合您打算使用它的数据。
关于swift - 使用拆分表与完全分离表(CreateML、Swift)时的评估准确度不同,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55444439/
当我尝试训练 CreateML 模型时,我在输入训练数据后看到以下屏幕: Create ML error message 然后我无法添加我的测试数据或训练模型。关于这里发生了什么的任何想法? [编辑]
所以我想训练 MLClassifier 来识别特定的设备运动。所以我所做的就是记录运动数据和我相应标记的非常记录的数据。当这并没有像我希望的那样有效时,我开始意识到我必须记录“ Action ”本身,
我正在 XCode playground 中测试新的很棒的 CreateML。我使用具有实时 View 功能的 MLImageClassifierBuilder() 来创建我的模型,并保存它。现在我想
我正在使用 CreateML 和 Swift 创建表格分类模型。我使用的数据集总共有大约 300 个项目,以及大约 13 个不同的特征。我已经尝试以两种方式训练/测试我的模型,并且得到了非常不同的结果
有谁知道如何从 Apple 的 Create ML App 中导出经过训练的 mlmodel - Catalina 中 XCode 附带的那个 最佳答案 完成训练后,它应该出现在右侧。把它拖到桌面上。
Apple 最近发布了一个允许创建机器学习模型的框架。我对 tabular data 感兴趣但我还没有在网上找到任何例子。谁能提供一段有效的代码?我尝试了 Apple 提供的以下方法但没有成功: im
我想使用 Create ML 框架创建一个具有一个特征和三个目标的 MLDataTable。例如,假设我正在创建一个日历应用程序,它具有添加快速事件的功能,如 native Mac 日历应用程序。我有
我想使用新的 CreateML 和 CreateMLUI Swift 框架。 但是当我写的时候: import CreateML Xcode 给我一个错误: No such module 'Creat
我正在尝试使用 Apple 的 Create ML 工具训练一个新的对象检测模型。我已经使用 RectLabel 为我的训练图像目录中的所有 JPEG 图像生成注释。 但是,每次我尝试在 Create
我正在使用 CreateML 使用以下格式的隐式数据集生成推荐模型:用户 ID、项目 ID。数据以大约 40 万行的 CSV 格式加载到 CreateML 中。 尝试“训练”模型时,我收到以下错误:
我正在使用 Playground 使用 CreateML 创建文本分类器模型并不断收到错误消息: Playground execution terminated: An error was throw
我是一名优秀的程序员,十分优秀!