gpt4 book ai didi

bots - LUIS - 理解任何人的名字

转载 作者:行者123 更新时间:2023-12-04 20:30:14 27 4
gpt4 key购买 nike

我们正在 LUIS 上构建产品/Microsoft Bot framework我们的疑问之一是对人名的理解。任何人只需注册我们的网站即可使用该产品。这意味着任何注册的公司显然都可以拥有任意数量的任何姓名的员工。

我们的理解是用户实体无法识别所有名称。我们创建了一个短语列表,但据我们所知,短语列表是有限制的(10K 甚至 100K),世界上的名字永远不会有限制。我们思考的另一种方式是不要用话语来训练实体。但是,如果我们有 100 个客户,每个客户有 1000 个用户,那么在这种情况下,话语就不是一个好主意。

我看不出有任何其他方法可以处理这种情况。可能我在这里遗漏了什么?任何人都遇到过类似的问题以及如何处理?

最坏的情况是为每个客户创建一个单独的 LUIS 实例,但这确实是一项艰巨的任务,因为我们无法处理名称。

最佳答案

您可能已经知道,一个人的名字实际上可以是任何东西:例如动物、汽车、月份或颜色。因此,没有任何确定的方法可以将某物识别为名称。最接近的是通过文本分析词性并进行猜测或与现有列表进行比较。 LUIS 或任何其他 NLP 工具不太可能对此有所帮助。这是一种可能效果更好的方法。尝试使用类似于 Microsoft 的文本分析认知服务的方法,将 POST 发送到关键短语端点,如下所示:

https://westus.api.cognitive.microsoft.com/text/analytics/v2.0/keyPhrases

和 body :

{
"documents": [
{
"language": "en-us",
"id": "myid",
"text": "Please book a flight for John Smith at 2:30pm on Wednesday."
}
]
}

那返回:
{
"languageDetection": {
"documents": [
{
"id": "e4263091-2d54-4ab7-b660-d2b393c4a889",
"detectedLanguages": [
{
"name": "English",
"iso6391Name": "en",
"score": 1.0
}
]
}
],
"errors": []
},
"keyPhrases": {
"documents": [
{
"id": "e4263091-2d54-4ab7-b660-d2b393c4a889",
"keyPhrases": [
"John Smith",
"flight"
]
}
],
"errors": []
},
"sentiment": {
"documents": [
{
"id": "e4263091-2d54-4ab7-b660-d2b393c4a889",
"score": 0.5
}
],
"errors": []
}
}

请注意,您将“John Smith”和“flight”作为关键短语返回。 “飞行”绝对不是一个名字,但“约翰史密斯”可能是,让你更好地了解这个名字是什么。此外,如果您有一个客户名称数据库,您可以将值与客户名称(精确或 soundex)进行比较,以增加您对该名称的信心。

有时,服务不会给您 100% 的答案,您必须创造性地解决问题。请查看 Text Analytics API docs了解更多信息。

关于bots - LUIS - 理解任何人的名字,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48182873/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com