gpt4 book ai didi

gf - 如何跟踪语法框架解析 : example WordNet imports badly

转载 作者:行者123 更新时间:2023-12-05 03:46:18 25 4
gpt4 key购买 nike

我正在尝试使用 WordNetEng 具体语法 https://github.com/GrammaticalFramework/gf-wordnet据我了解,它使用了所有标准语法功能(来自 GF 基本安装),但极大地扩展了词典。我的 GF 安装正常,例如:

> import C:\Workspace-Data\GF\AllEng.gfo
linking ... OK

Languages: AllEng
3031 msec
AllEngAbs> parse "turtle is good"
The parser failed at token 1: "turtle"
31 msecAllEngAbs> parse "dog is good"
PredVPS (MassNP (UseN dog_N)) (MkVPS (TTAnt TPres ASimul) PPos (UseComp (CompAP (PositA good_A))))
PredVPS (MassNP (UseN dog_N)) (MkVPS (TTAnt TPres ASimul) PPos (UseComp (CompNP (AdjAsNP (PositA good_A)))))
...

但我可以导入 WordNetEng,但它既不识别乌龟,也不识别其他常见单词,包括狗:

AllEngAbs> import C:\Workspace-Data\GF\WordNetEng.gf
linking ... OK

Languages: WordNetEng
5468 msec
WordNet> parse "tortoise is good"
The parser failed at token 1: "tortoise"
4234 msec
WordNet> parse "dog is good"
The parser failed at token 1: "dog"
0 msec

怎么了? GF如何导入语法(相当复杂的文件集)然后不能解析最简单的句子?我该如何调试并更正它?谢谢!

也许可以选择列出 session 中导入的所有语法类别或终端,例如这样我就可以看到 "tortoise" 是否被导入了?

我尝试生成随机句子,但出现奇怪的错误:

WordNet> gr
no trees found
0 msec

最佳答案

WordNet 词典只是一个词典。它使用标准 RGL 中的类别,但不使用 RGL 函数的其余部分。这是 the abstract syntax :

abstract WordNet = Cat ** {

fun a_bomb_N : N ;
...
fun zymotic_2_A : A ;
}

所以你的结果完全符合预期。

用RGL+WordNet解析

如果你想用 RGL 和 WordNet 词典进行解析,你可以在同一个 repo 中使用 Parse 模块,gf-wordnet/Parse.gf .

不过要注意,语法可能非常含糊。大多数歧义来自每个单词都有多个版本的事实,但您也可以尝试注释掉 ParseExtend 并查看这是否有助于多个解析。

像这样使用它:

$ gf ParseEng.gf
Parse> p "I am a human"
PhrUtt NoPConj (UttS (UseCl (TTAnt TPres ASimul) PPos (PredVP (UsePron iFem_Pron) (UseComp (CompCN (UseN human_N)))))) NoVoc
PhrUtt NoPConj (UttS (UseCl (TTAnt TPres ASimul) PPos (PredVP (UsePron iFem_Pron) (UseComp (CompNP (DetCN (DetQuant IndefArt NumSg) (UseN human_N))))))) NoVoc
PhrUtt NoPConj (UttS (UseCl (TTAnt TPres ASimul) PPos (PredVP (UsePron i_Pron) (UseComp (CompCN (UseN human_N)))))) NoVoc
PhrUtt NoPConj (UttS (UseCl (TTAnt TPres ASimul) PPos (PredVP (UsePron i_Pron) (UseComp (CompNP (DetCN (DetQuant IndefArt NumSg) (UseN human_N))))))) NoVoc

但它仍然会有歧义,因为有些词属于许多不同的同义词集(good 词有 20 个同义词集),而一个长句子可能包含多个这样的词。

在应用语法中使用 WordNet 词典

如果您编写应用程序语法,您可以随时在其中打开 WordNet,就像任何其他模块一样。例如,重新创建 Foods example从教程中,我们可以像这样编写参数化模块(仿函数)FoodsI.gf:

    incomplete concrete FoodsI of Foods = open Syntax, WordNet in {
lincat
Phrase = Cl ;
Item = NP ;
Kind = CN ;
Quality = AP ;
lin
Is item quality = mkCl item quality ;
This kind = mkNP this_Det kind ;
That kind = mkNP that_Det kind ;
These kind = mkNP these_Det kind ;
Those kind = mkNP those_Det kind ;
QKind quality kind = mkCN quality kind ;
Very quality = mkAP very_AdA quality ;

Wine = mkCN wine_1_N ; -- All these from WordNet
Fish = mkCN fish_2_N ;
...
}

并为这样的具体语言实例化它

    concrete FoodsEng of Foods = FoodsI with
(Syntax = SyntaxEng),
(LexFoods = WordNetEng) ;

关于gf - 如何跟踪语法框架解析 : example WordNet imports badly,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65372781/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com