machine-learning - 什么是弱监督学习(引导)？-6ren

machine-learning - 什么是弱监督学习(引导)？

转载作者：行者123 更新时间：2023-11-30 08:21:24

27

4

我了解监督学习和无监督学习之间的区别:

监督学习是一种使用标记数据“教导”分类器的方法。

无监督学习让分类器“自行学习”，例如使用聚类。

但是什么是“弱监督学习”？它如何对示例进行分类？

最佳答案

更新答案

正如下面的几条评论提到的，情况并不像我最初在 2013 年写的那么简单。

普遍接受的观点是

弱监督 - 使用嘈杂标签进行监督 ( wikipedia )
半监督 - 只有训练数据的子集有标签 ( wikipedia )

还有一些分类更符合我原来的答案，例如Zhi-Hua Zhou's 2017 A brief introduction to weakly supervised learning认为弱监管是一个总称

不完整监督 - 只有训练数据的子集有标签(与上述相同)
不精确监督 - 在仅使用粗粒度标签给出训练数据的情况下调用
不准确监督 - 给定的标签并不总是真实的(上面的弱监督)。

<小时/>

原始答案

简而言之:在弱监督学习中，您使用有限数量的标记数据。

如何选择此数据以及您到底用它做什么取决于方法。一般来说，您使用有限数量的易于获取和/或产生真正影响的数据，然后学习其余的数据。我认为引导是一种可以用于弱监督学习的方法，但正如下面 Ben 的评论所示，这并不是一个普遍接受的观点。

例如，参见 Chris Bieman's 2007 dissertation为了更好地概述，它对引导/弱监督学习做了以下说明:

Bootstrapping, also called self-training, is a form of learning thatis designed to use even less training examples, therefore sometimescalled weakly-supervised. Bootstrapping starts with a few trainingexamples, trains a classifier, and uses thought-to-be positiveexamples as yielded by this classifier for retraining. As the set oftraining examples grows, the classifier improves, provided that nottoo many negative examples are misclassified as positive, which couldlead to deterioration of performance.

例如，在词性标注的情况下，人们通常会在 10,000 个单词上训练 HMM(或最大熵或其他)标注器，每个单词都有它的 POS。在弱监督标记的情况下，您可以简单地使用包含 100 个单词的非常小的语料库。你得到一些标记器，用它来标记 1000 个单词的语料库，在其上训练标记器并用它来标记更大的语料库。显然，你必须比这更聪明，但这是一个好的开始。 (有关引导标记器的更高级示例，请参阅 this paper)

注意:弱监督学习也可以指带有噪声标签的学习(此类标签可以但不一定是引导的结果)

关于machine-learning - 什么是弱监督学习(引导)？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/18944805/

27

4

0

文章推荐： artificial-intelligence - FIND-S 算法 - 简单问题

erlang - 尽力而为的 OTP 监督
我想做的是改变我的主管，尽最大努力让 children 运行，但如果他们的崩溃率超过强度，就放弃。这样剩下的 child 就可以继续跑。不过，这对于现有的主管配置来说似乎是不可能的，所以看起来我唯一的
Python 监督 ML 文本以概率分类为不同类别
我正在处理一个大型推文数据集，我从中将一小部分数据训练为四个手动分类的类别。每个手动分类大约有二十条推文，而数据集有数万条推文。这是我用来训练模型的代码。 from sklearn.feature_e
python - 用主管和 virtualenv 监督 celerybeat
我的 celerybeat.conf [program:celerybeat] command=/path/app/env/bin/celery beat -A project.tasks --log
apache-zookeeper - 使用 Supervisord 监督 ZooKeeper
正如 ZooKeeper 的文档中所说，有必要使用 daemontools 之类的工具对其进行监督。但是文档没有提供任何示例，我知道启动 ZooKeeper 的唯一方法是运行 bin/zkServer
ios - 了解 uibutton 目标 self 监督
谁能给我解释一下这个例子中的 uibutton 目标功能: 我有一个 ViewController。我向这个 View Controller 添加了一个带有两个按钮的 uiview。一个按钮是在 in
java - Erlang OTP 监督 Java 应用程序
我最近熟悉了 Erlang/OTP 技术，我想将其应用于监控和监督 Java 应用程序: 检测他们的可用性启动和停止它们换句话说，我希望 Java 应用程序被 Erlang OTP 主管基础架构视
c# - MVC 和 MVP 监督 Controller 是否相同？
这个问题在这里已经有了答案: 关闭 11 年前。 Possible Duplicate: What are MVP and MVC and what is the difference? 我在网站上

首页

博学

6Ren·AI

商城