gpt4 book ai didi

c# - 实体注释在 RASA NLU 中有空格

转载 作者:太空宇宙 更新时间:2023-11-03 20:58:05 26 4
gpt4 key购买 nike

我正在浏览 Training Data RASA Format详见此处。

{
"text": "show me chinese restaurants",
"intent": "restaurant_search",
"entities": [
{
"start": 8,
"end": 15,
"value": "chinese",
"entity": "cuisine"
}
]
}

子字符串Chinese被标记为从话语的第8个到第15个索引的实体。

我写了一个小的 C# 程序来验证话语中字符索引的正确性。

public class Program
{
public static void Main(string[] args)
{
string s = "show me chinese restaurants";
int i = 0;

foreach(var item in s.ToCharArray())
Console.WriteLine("{0} - {1}", item, i++);
}
}

但是当我运行程序时,我得到以下输出:

s - 0
h - 1
o - 2
w - 3
- 4
m - 5
e - 6
- 7
c - 8
h - 9
i - 10
n - 11
e - 12
s - 13
e - 14
- 15
r - 16
e - 17
s - 18
t - 19
a - 20
u - 21
r - 22
a - 23
n - 24
t - 25
s - 26

请注意文本注释的奇怪行为,子字符串 Chinese 从索引 8 开始,到 15 结束,并带有一个空格。

但是子字符串Chinese应该从索引8开始到位置14结束。

当我使用从位置 8 开始到 14 结束的索引训练相同的文本 Chinese 时。我收到 RASA 发出的 Misaligned Entity Annotation 警告,详情 here .

谁能解释一下这种奇怪的行为。

谢谢

最佳答案

正在阅读链接 provided我可能想出了一个可能的解释:

which together make a python style range to apply to the string, e.g. in the example below, with text="show me chinese restaurants", then text[8:15] == 'chinese'

这让我走上了我所想的道路

Hmmm that is weird i wonder if python does indexing wierdly

我启动了一个快速应用来证明这一点:

text = "show me chinese restaurants"
print(text[8:15])

现在这可能没有意义,因为这里数组的空间 15 中的字符实际上是一个空间。这让我看到了这篇文章:

https://www.pythoncentral.io/how-to-slice-listsarrays-and-tuples-in-python/

看起来他们在这里的示例中使用的运算符 text[8:15] 对数组进行切片,他们使用示例:

a = [1, 2, 3, 4, 5, 6, 7, 8]

a[1:4] 输出:[2, 3, 4]

并这样解释

Let me explain it. The 1 means to start at second element in the list (note that the slicing index starts at 0). The 4 means to end at the fifth element in the list, but not include it. The colon in the middle is how Python's lists recognize that we want to use slicing to get objects in the list.

所以看起来切片的第二个参数是独占的。

希望对你有帮助

附注必须学习和设置一些 python 东西 :D

关于c# - 实体注释在 RASA NLU 中有空格,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48360799/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com