- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个手动制定的 DCG 规则来选择惯用短语超过单个单词。 DCG规则如下:
seq(cons(X,Y), I, O) :- noun(X, I, H), seq(Y, H, O), \+ noun(_, I, O).
seq(X) --> noun(X).
第一个子句是手动创建的,因为使用了 (:-)/2
(-->)/2
。我可以将这个手动创建的子句替换为一些使用标准 DCG 的子句?
最诚挚的问候
P.S.:这是一些测试数据:
noun(n1) --> ['trojan'].
noun(n2) --> ['horse'].
noun(n3) --> ['trojan', 'horse'].
noun(n4) --> ['war'].
这里是一些测试用例,重要的测试用例是第一个测试用例,因为它只传递 n3 而不是 cons(n1,n2)。第一个测试用例的行为是特别需要的:
?- phrase(seq(X),['trojan','horse']).
X = n3 ;
No
?- phrase(seq(X),['war','horse']).
X = cons(n4,n2) ;
No
?- phrase(seq(X),['trojan','war']).
X = cons(n1,n4) ;
No
最佳答案
(为了避免与其他非终端发生冲突,我将您的 seq//1
重命名为 nounseq//1
)
Can I replace this manually made clause by some clause that uses standard DCG?
不,因为它不是坚定的,它是 STO(详情如下)。
但是让我从你的程序的预期含义开始。您说您想要选择惯用短语而不是单个单词。你的程序真的这样做吗?或者,换句话来说,你的定义真的很独特吗?我现在可以构造一个反例,但让 Prolog 来思考:
nouns --> [] | noun(_), nouns.?- length(Ph, N), phrase(nouns,Ph), dif(X,Y), phrase(nounseq(X),Ph), phrase(nounseq(Y),Ph). Ph = [trojan,horse,trojan], N = 3, X = cons(n1,cons(n2,n1)), Y = cons(n3,n1); ...; Ph = [trojan,horse,war], N = 3, X = cons(n3,n4), Y = cons(n1,cons(n2,n4)); ... .
所以你的定义不明确。您本质上想要的(可能)是某种重写系统。但这些很少以明确的方式定义。如果两个单词像附加的名词(n5) --> [horse, war].
等重叠,会怎样?
预先声明:目前,DCG 文档仍在开发中 - 非常欢迎提出意见!您找到所有 Material in this place 。所以严格来说,目前 DCG 还没有一致性的概念。
一致的定义必须保持的一个核心属性是坚定性。因此,在研究您的定义之前,我将比较 phrase/3
的两个目标(在默认模式下运行 SWI)。
?- Ph = [], phrase(nounseq(cons(n4,n4)),Ph0,Ph). Ph = [], Ph0 = [war,war]; false.?- phrase(nounseq(cons(n4,n4)),Ph0,Ph), Ph = []. false.?- phrase(nounseq(cons(n4,n4)),Ph0,Ph). false.
将目标Ph = []
移动到最后,删除唯一的解决方案。因此,你的定义并不坚定。这是由于您处理 (\+)/1
的方式造成的:变量 O
不得出现在 (\+)/1
中>。但另一方面,如果它没有出现在 (\+)/1
内,您只能检查句子的开头。而不是整个句子。
但情况更糟:
?- set_prolog_flag(occurs_check,error). true.?- phrase(nounseq(cons(n4,n4)),Ph0,Ph).ERROR: noun/3: Cannot unify _G968 with [war|_G968]: would create an infinite tree
因此,您的程序依赖于 STO 统一(subject-to-occurrs-check 统一),其结果在中明确未定义
ISO/IEC 13211-1 Subclause 7.3.3 Subject to occurs-check (STO) and not subject to occurs-check (NSTO)
这实际上是由于您打算定义两个非终结符的交集。考虑以下表达方式:
:- op( 950, xfx, //\\). % ASCII approximation for ∩ - 2229;INTERSECTION(NT1 //\\ NT2) --> call(Xs0^Xs^(phrase(NT1,Xs0,Xs),phrase(NT2,Xs0,Xs))).
% 以下是在 library(lambda)
中预定义的:
^(V0, Goal, V0, V) :- call(Goal,V).^(V, Goal, V) :- call(Goal).
有了这个定义,我们就可以进入 STO 的情况了:
?- phrase(([a]//\\[a,b]), Ph0,Ph).ERROR: =/2: Cannot unify _G3449 with [b|_G3449]: would create an infinite tree
事实上,当使用有理树时,我们得到:
?- set_prolog_flag(occurs_check,false). true.?- phrase(([a]//\\[a,b]), Ph0,Ph). Ph0 = [a|_S1], % where _S1 = [b|_S1], Ph = [b|_S1].
因此,存在一个无限列表,对于自然语言句子来说当然没有多大意义(除了拥有无限资源和能力的人......)。
关于prolog - DCG 惯用短语偏好,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13782324/
我们正在使用一个脚本,它会返回以下内容120007CONSULTA DE DEUDA CORRECTA.01TEST我正在尝试从awk中获得 CONSULTA DE DEUDA CORRECTA 的短
我正在使用以下查询: { "_source": [ "title", "bench", "id_", "court",
例如,我有数十亿个短语,我想要将相似的短语聚集在一起。 > strings.to.cluster <- c("Best Toyota dealer in bay area. Drive out wit
我有一个包含大约 1000 个关键字/短语(一到四个字长)的数据库表 - 这个表很少更改,所以我可以将数据提取到更有用的东西中(比如正则表达式?) - 所以这没有找到/基于自然语言处理猜测关键词..
我想确保我从一开始就做对了,但我找不到好的答案,所以我想问一下。 我要做的是以下内容。 以一句话为例:The quick brown fox jumped over the lazy dog"并使用全
我有一个表单,其中有两个单选按钮。 应该从字符串中搜索整个字符串,第二个应该搜索至少一个单词。 例如: 我将搜索“Awesome ideas for startup”。 如果我选中“搜索整个字符串/短
我有... 一组固定关键字和词组(大约 1,000,000 个),例如 birthday、happy new year、vacation等 10 到 500 字之间的一些可变文本。 我想…… 识别文本
有没有办法删除字符串中重复的和连续的单词/短语?例如。 [in]: foo foo bar bar foo bar [out]: foo bar foo bar 我试过这个: >>> s = 'thi
我正在寻找一种在文本中搜索短语或惯用表达的方法,无论时态或可能的介词/副词如何,例如如果我正在寻找 call off我还想找到 My boss called the meeting off. 之类的用
PowerShell 有一些语法特性,我找不到太多相关文档。今天我的问题是 ? {...} 例子 PS> Get-SPServiceInstance | ? {$_.GetType.toString(
我通过 PHP 使用 Solr 来搜索我网站的各个方面。我正在尝试实现一项功能,但找不到任何有关如何实现它的信息。 我有一组文档(评论),每个文档都与特定产品有关。 我想找到出现在单个产品的多条评论中
我正在从事自然语言生成任务,需要检索与 Cyc 术语等效的自然语言单词或短语。例如。 “#$EatingEvent”->“吃”或“#$Coyote-Animal”->“土狼”。 如何通过 Java A
我在使用 Java 中的以下正则表达式时遇到问题。我删除了双引号,以使其更具可读性。由于缺乏更好的词,我还将每个“组件”放在单独的行上(但实际的表达式会将行合并,行之间没有空格): (?:\bIN(?
我有一个 MySQL 数据库,我正在尝试使用 PHP 获取趋势主题(流行短语或单词)。我尝试了一些查询,但似乎没有什么对我有用。 最佳答案 您可以尝试创建一个包含两列的新表:WORD 和 COUNT,
我在 MySql 中有一个包含城市的表。 |---------------------|------------------| | ID | City
我正在处理搜索页面上的用户输入。如果用户选择“所有单词”类型的搜索,那么我会从搜索文本中删除所有 bool 搜索运算符,并在每个真实单词之间添加 ' AND '。在大多数情况下非常简单。但是,我不知道
我使用的语音识别软件给出的结果不是最佳的。 例如:session 返回为 fashion 或 mission。 现在我有一本像这样的字典: matches = { 'session': ['fas
我厌倦了使用 Gimp 无休止地滚动所有字体来不规律地搜索完美字体,所以我想:“为什么不为每种字体构建一个可视的 pangrams 列表”。 因此,我尝试构建一个 php 脚本,该脚本在 .fonts
如何编写一个 RegEx 模式来测试一个字符串是否包含多个具有以下结构的子字符串: "cake.xxx" xxx 是任何东西,但不是“奶酪”、“牛奶”或“黄油”。 例如: “我有一个 cake.hon
我有一个字段“部门”,它是一个列表:{“部门”:[“餐饮服务”,“软件开发”,“制造”,“部署”]}' 我想聚合“部门”中以“d”开头的元素。即,从所有记录进行部署。 我能够找到包含一个前缀为“d”但
我是一名优秀的程序员,十分优秀!