gpt4 book ai didi

machine-learning - NLP 解析单个查询中包含的多个问题

转载 作者:行者123 更新时间:2023-11-30 08:53:57 25 4
gpt4 key购买 nike

如果用户的单个查询包含属于不同类别的多个问题,如何识别、拆分和解析它们?

例如 -

User - what is the weather now and tell me my next meeting  
Parser - {:weather => "what is the weather", :schedule => "tell me my next meeting"}

解析器识别问题属于两个不同类别的句子部分

User - show me hotels in san francisco for tomorrow that are less than $300 but not less than $200 are pet friendly have a gym and a pool with 3 or 4 stars staying for 2 nights and dont include anything that doesnt have wifi  
Parser - {:hotels => ["show me hotels in san francisco",
"for tomorrow", "less than $300 but not less than $200",
"pet friendly have a gym and a pool",
"with 3 or 4 stars", "staying for 2 nights", "with wifi"]}

解析器识别出仅属于一个类别的问题,但具有用于微调答案的附加步骤,并创建了一个根据要采取的步骤排序的数组

据我所知,这需要句子分段器多标签分类器共指解析

但是我遇到的句子分割器很大程度上依赖于语法和标点符号。

多标签分类器,就像训练有素的朴素贝叶斯分类器一样,在大多数情况下都有效,但由于它们是多标签的,因此大多数时候会为明显属于一类的句子输出多个类别。仅依靠数组输出来检查存在的标签将会失败。

如果使用多类分类器,这也可以很好地检查可能类别的数组输出,但显然它们不能非常准确地告诉句子的不同部分,更不用说以什么方式进行下一步了。

第一步,如何调整句子分段器以在没有任何严格语法规则的情况下正确分割句子。良好的准确性将对分类有很大帮助。

最佳答案

As a first step, how can I tune sentence segmenter to correctly split the sentence without any strict grammar rules.

我建议您直接使用解析树(依赖解析器或选区解析器),而不是这样做。

这里我显示了依赖项解析的输出,您可以看到两个段通过“CONJ”箭头分隔:

enter image description here

(从这里:http://deagol.cs.illinois.edu:8080/)

我尝试的另一个解决方案是 ClausIE: https://gate.d5.mpi-inf.mpg.de/ClausIEGate/ClausIEGate?inputtext=what+is+the+weather+now+and+tell+me+my+next+meeting++&processCcAllVerbs=true&processCcNonVerbs=true&type=true&go=Extract

关于machine-learning - NLP 解析单个查询中包含的多个问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46042014/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com