- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我一直在尝试让单词级语言模型在 lingpipe 上工作。我遇到的所有示例和教程都展示了字符-n-语法模型。如何使用 lingpipe 训练单词级模型,然后使用该模型在其他文档上进行测试?
此外,我注意到 TokenizedLM 不可序列化。有没有办法可以保存它并稍后加载,而不必每次都进行重新训练?
最后,是否有任何其他框架/工具可以让我无需编写任何代码即可完成此操作?
最佳答案
我不了解 Java,但如果您不受该编程语言的束缚,可以使用 Python NLTK ,其中有 tokenizers和 ngram-models还有很多other stuff 。还有一个book它可以用作介绍并获得概述。
关于java - 使用 Lingpipe 进行词级语言模型,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8031657/
我想通过 lingpipe 中的伯努利分类器对我的数据进行分类如果有人有它的工作方法,请分享 最佳答案 http://java2s.com/Open-Source/Java/Natural-Langu
我一直在尝试让单词级语言模型在 lingpipe 上工作。我遇到的所有示例和教程都展示了字符-n-语法模型。如何使用 lingpipe 训练单词级模型,然后使用该模型在其他文档上进行测试? 此外,我注
我正在尝试在 > 20GB 的大数据集上训练 DynamicLMClassifier.createNGramProcess(categories,nGram)。我目前正在将整个训练文件作为字符串提供给
这个问题只针对那些已经用过LingPipe了。我的问题是如何加载 GENIA 语料库用于词性标记。当我开始解析它时,我收到一条错误消息我从内存堆中取出了。谢谢。 最佳答案 设置环境变量以允许更大的最大
我正在使用 lingpipe 进行情感分析(遵循 this 代码),并且我尝试在训练后存储分类器。问题是存储后我无法加载它: java.lang.ClassCastException: com.ali
我使用Lingpipe的情感分析模块实现了情感分析。我知道他们为此使用动态 LR 模型。它只是告诉我测试字符串是积极情绪还是消极情绪。我可以用什么想法来确定表达情感的对象? 如果文本被归类为积极情绪,
我想根据数据的内容将某些数据分类到不同的类别中。我使用朴素贝叶斯分类器做到了这一点,我得到的输出是它所属的最佳类别。但是现在我想将训练集中以外的新闻分类到“其他”类中。我无法手动将训练数据以外的每个/
我在现有的 ant-buildfile 选项下打开 lingpipe,然后创建一个包将 PolarityBasic.java 放入包中 我确实更改了mPolarityDir=new file("Des
我正在尝试对某些文档执行基于字典的 NER。无论数据类型如何,我的字典都由字符串的键值对组成。我想搜索文档中的所有键,并在匹配出现时返回该键的相应值。 问题是,我的字典相当大:大约 700 万个键值
这是在使用 LingPipe 机器学习工具进行情感分析的背景下进行的。我必须对大段落中的句子是否具有积极/消极情绪进行分类。我知道 LingPipe 中有以下方法 根据整个段落的极性(消极或积极)对整
我正在尝试使用 Lingpipe 工具从阿拉伯文本中提取命名实体识别(人名)。我读过关于这个工具的教程 http://alias-i.com/lingpipe/demos/tutorial/ne/re
我希望从非常短的文本示例中提取名称和地点 “多伦多红雀队对阵松鸦队” “Daniel Nestor 和 Nenad Zimonjic 扮演 Jonas Bjorkman 和 Kevin Ullyett
我正在使用 GATE NLP 来处理我的文档,我想使用实体名称作为候选标签在 Gate 中有 OpenNLP 和 LingPipe当我阅读答复表格时 here @Shashikant Kore 回答他
我阅读了 Lingpipe for NLP,发现我们有能力识别提及的人名、地点和组织名称。我的问题是,如果我有一个文档训练集,其中提到了文本中的软件项目,我可以使用这个训练集来训练命名实体识别器吗?培
我是一名优秀的程序员,十分优秀!