crf - 如何制作CRF++的模板文件？-6ren

crf - 如何制作CRF++的模板文件？

转载作者：行者123 更新时间：2023-12-04 03:57:55

29

4

我是CRF++的新手。我在教自己看它的手册:
http://crfpp.googlecode.com/svn/trunk/doc/index.html?source=navbar#templ
我不明白这是什么意思:

This is a template to describe unigram features. When you give a

template "U01:%x[0,1]", CRF++ automatically generates a set of feature

functions (func1 ... funcN) like:

func1 = if (output = B-NP and feature="U01:DT") return 1 else return 0

func2 = if (output = I-NP and feature="U01:DT") return 1 else return 0

func3 = if (output = O and feature="U01:DT") return 1 else return 0

.... funcXX = if (output = B-NP and feature="U01:NN") return 1 else return 0

funcXY = if (output = O and feature="U01:NN") return 1 else return 0. The number of feature functions generated by a template

amounts to (L * N), where L is the number of output

为什么Unigram功能有很多行，它们是什么意思？

最佳答案

在看了the documentation足够长的时间之后，我想我已经明白了。

以文档中的示例为例，输入数据为:

He        PRP  B-NP
reckons   VBZ  B-VP
the       DT   B-NP 
current   JJ   I-NP 
account   NN   I-NP

而相关的功能模板(格式为 %x[row, col]，其中 row相对于您当前位置)为 %x[0,1]
扩展 %x[0,1]时，根据当前 token 的不同，它可以扫描设置的 [PRP, VBZ, DT, JJ, NN]内部的字符串之一(即第1列中唯一的字符串之一，其中最左边的列是第0列)。对于这些字符串中的每一个，它都会创建一组形式如下的特征函数(查看输入数据的第三行):

func1 = if (output = B-NP and feature="U01:DT") return 1 else return 0
func2 = if (output = I-NP and feature="U01:DT") return 1 else return 0
func3 = if (output = O    and feature="U01:DT") return 1 else return 0
...

将该特定字符串(以上代码中的 DT)与每个单个输出类进行比较。

因此，如果输出类是 [B-NP, I-NP, O]，则扩展为要素函数的要素模板将如下所示:

# row 1 (He, PRP, B-NP)
func1 = if (output = B-NP and feature="U01:PRP") return 1 else return 0
func2 = if (output = I-NP and feature="U01:PRP") return 1 else return 0
func3 = if (output = O    and feature="U01:PRP") return 1 else return 0

# row 2 (Reckons, VBZ, B-VP)
func4 = if (output = B-NP and feature="U01:VBZ") return 1 else return 0
func5 = if (output = I-NP and feature="U01:VBZ") return 1 else return 0
func6 = if (output = O    and feature="U01:VBZ") return 1 else return 0

# Row 3 (the, DT, B-NP)
func7 = if (output = B-NP and feature="U01:DT") return 1 else return 0
func8 = if (output = I-NP and feature="U01:DT") return 1 else return 0
func9 = if (output = O    and feature="U01:DT") return 1 else return 0

# Row 4 (current, JJ, I-NP)
func10 = if (output = B-NP and feature="U01:JJ") return 1 else return 0
func11 = if (output = I-NP and feature="U01:JJ") return 1 else return 0
func12 = if (output = O    and feature="U01:JJ") return 1 else return 0

# Row 5 (account, NN, I-NP)
func13 = if (output = B-NP and feature="U01:NN") return 1 else return 0
func14 = if (output = I-NP and feature="U01:NN") return 1 else return 0
func15 = if (output = O    and feature="U01:NN") return 1 else return 0

关于文档中提到的内容:

The number of feature functions generated by a template amounts to (L * N), where L is the number of output classes and N is the number of unique strings expanded from the given template.

在这种情况下，L为3，N为5。

关于crf - 如何制作CRF++的模板文件？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/25477896/

29

4

0

文章推荐： gnuplot - 如何在gnuplot中绘制带有彩色边框的矩形

文章推荐： sencha-touch - Sencha Touch 浏览器导航后退按钮

文章推荐： web-services - 使用 Rest Web 服务的 Soap 客户端

文章推荐： freeze - tmux session 随机停止更新屏幕

crf - 如何制作CRF++的模板文件？
我是CRF++的新手。我在教自己看它的手册: http://crfpp.googlecode.com/svn/trunk/doc/index.html?source=navbar#templ 我不明白
FFmpeg 流式传输低 CRF 导致质量低下
我正在使用以下参数与 FFmpeg 进行流式传输(实时聊天)。 ffmpeg -f dshow -rtbufsize 100M -i video="device":audio="device" \ -
ffmpeg - FFmpeg CRF 的工作原理
FFmpeg -CRF作品？他们如何决定这一特定秒的最佳质量？如果我将文件按秒分割并用 -CRF 分别对每个切片进行编码，我们会得到更好的结果吗？然后加入所有切片，或者我会得到相同/更差的结果，为
nlp - 如何将地名词典或词典表示为 crf++ 中的特征？
如何使用地名词典或词典作为 CRF++ 中的功能？详细说明:假设我想对人名进行 NER，并且我有一个包含常见人名的地名词典(或字典)，我想使用这个地名词典作为 crf++ 的输入，我该怎么做？我正
nlp - 在槌中处理 CRF 的整数值特征
我刚刚开始在槌中使用 SimpleTagger 类。我的印象是它需要二进制功能。我想要实现的模型具有正整数值特征，我想知道如何在 mallet 中实现它。另外，我听说如果要使模型有意义，则需要对非二进
machine-learning - CRF++中使用的边际概率公式是什么？
CRF++ 说它可以: 其页面上的“可以输出所有候选者的边际概率”:http://crfpp.sourceforge.net/ 但是在条件随机场中用于查找这些概率的公式的表示法是什么？有人告诉我这不
java - Mallet CRF 序列分类训练数据格式
我正在尝试使用 Mallet 库训练 CRF 序列模型，但缺少一些重要信息。我在库本身中找到了一个示例:https://github.com/mimno/Mallet/blob/master/src/
linux - CRF+0.58训练NE模型失败
当我使用CRF++0.58对NE建模时程序出现问题: “读取训练数据:tagger.cpp(399) [feature_index_->buildFeatures(this)] 0.00s” 开发环境
c++ - 计算机视觉问题的开源 CRF 实现？
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题，以便用事实和引用来回答。关闭 7 年前。
python - 线性链 CRF 分类器使用哪个激活函数？
我有一个序列标记模型，可以预测输入序列中每个单词的标记(本质上称为实体识别)。模型结构:Embeddings层→BiLSTM→CRF 因此，本质上，BiLSTM 基于标记嵌入学习特征的非线性组合，并使
java - ffmpeg 中无法识别的选项 'crf 21'
我正在尝试在一个简单的 jar 应用程序中使用 ffmpeg 转换视频，但是我得到了这个 Unrecognized option 拆分参数列表时出错:找不到选项。我正在执行以下操作: List c
video - 特定区域的 h265 和 CRF
我需要创建一个 h265，其区域使用不同的 CRF 压缩。我正在考虑使用具有不同 CRF 的 h265 从原始视频生成 2 个压缩视频，然后混合每个帧。最后一步是使用两者之间的最小 CRF 从混合帧
image-processing - 使用 CRF 的图像标记性能
我需要开发一个图像标记应用程序，为此我正在考虑在一组超像素上使用条件随机场 (CRF)，有很多论文指出这项技术是最先进的这个任务。与往常一样，该任务可以分为两个任务: 训练模型:对于这个问题，将获取参
image-processing - CRF++ 或 CRFSuite
我开始使用 crf++ 和 crfsuite(两者都使用非常相似的文件格式)。我想做与图像相关的事情(分割、 Activity 识别等)。我的主要问题是如何构建训练文件。有人使用 crf 和图像吗？有
machine-learning - CRF++/Wapiti 包括整个句子的类别作为特征
如何将朴素贝叶斯预测的句子类别表示为 CRF++ 或 Wapiti 中的特征？例如，如果Tumblr merges with Yahoo.这个句子被分类为Business，那么在为crf编写训练文件
machine-learning - CRF(条件随机场)可以用来标记整个句子吗？
我正在尝试使用机器学习来标记句子(每个句子都有一个标签，我假设句子是相互独立的)。我认为线性 CRF 模型适合这种情况，但我有一些问题。我尝试使用CRF++ (我看到的其他实现似乎具有类似的格式)。
machine-learning - 我可以在 CRF 模型中使用数值特征吗
在 CRF 模型中添加数值特征是否可能/很好？例如序列中的位置。我正在使用CRFsuite 。似乎所有功能都会转换为字符串，例如'pos=0'、'pos=1'，这样就失去了欧氏距离的含义。或者我应
java - Java 中的线程安全或多线程 CRF 支持连续变量？
我想使用 Mallet 在相当大的数据集上以留一序列方式运行条件随机字段。因此，我需要多线程计算来处理这个计算问题，要么通过 1) 并行训练多个 CRF，每个 CRF 在单个线程上训练，要么 2) 以
java - Mallet CRF 分类器出现 OutOfMemoryError
分类器经常因 OutOfMemoryError 失败。请提出建议。我们有 UIMA 管道，它调用 5 个模型 jar(基于 mallet CRF)，每个大约 30MB。 -Xms 设置为 2G，-X
java - 如何加载和使用经过 Mallet 训练的 CRF？
我使用 GenericAcrfTui 训练了一个 CRF，它将一个 ACRF 写入一个文件。我不太确定如何加载和使用经过训练的 CRF 但是 import cc.mallet.grmm.learnin

首页

博学

6Ren·AI

商城

crf - 如何制作CRF++的模板文件？