- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
是否有任何方法可以使用 ntlk 或其他方法从句子的依存分析树中获取置信度得分或任何得分?
如有任何意见和建议,我们将不胜感激!
最佳答案
这是一项艰巨的任务,我不知道有任何工具可以做到这一点,但如果您可能在语料库邮件列表或 Reddit 的语言技术部分上发布一些内容,您会得到更好的回复。但如果这是一个研究问题,我建议在 penntreebank 数据集上训练 PCFG,然后用它来计算分配给句子的解析树的概率。您可以抢Mark Johnson's执行。搜索这一行:
cky.tbz contains a very fast C implementation of a CKY PCFG parser, together with programs for extracting PCFGs from treebanks, etc. This was used in my 1999 CL article. (last updated 6th March, 2006)
CYK(维特比)是一种动态规划算法。 PCFG 代表概率 CFG,通常使用 penntreebank 数据集进行训练。一个句子的所有可能解析树的概率之和可以解释为该句子在语法上的正确程度。抱歉,如果这不是实际答案,但这是一个可行的答案,如果您决定这样做,我可以告诉您更多详细信息:)。
关于python - 如何从依存分析树计算置信度得分?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38393554/
用例: 我有一个小数据集,每个类大约有 3-10 个样本。我正在使用 sklearn SVC 对具有 rbf 内核的那些进行分类。我需要预测的置信度以及预测的类别。我使用了 SVC 的 predict
我有这个 future 10 年回归样本。 date<-as.Date(c("2015-12-31", "2014-12-31", "2013-12-31", "2012-12-31")) value
我正在使用 Python NLTK 库中的 MaxEnt 分类器。对于我的数据集,我有许多可能的标签,并且正如预期的那样,MaxEnt 仅返回一个标签。我已经训练了我的数据集并获得了大约 80% 的准
我们如何在 Windows 中使用 tesseract 3.05 获得图像 OCR 后的置信度?我正在使用子进程命令从 python 调用 tesseract: retcode = subproces
我正在使用 trainsimplicit来自 ALS在 Spark 。 从文档页面:http://spark.apache.org/docs/latest/api/python/pyspark.mll
正在为 GNU Radio OOT 开发基于 Python 的 BER 置信度计算器。根据引用文献 1,置信度由以下公式计算 但是,引用文献2使用以下公式计算置信度: 第一个问题是关于两个公式的。他们
我是一名优秀的程序员,十分优秀!