gpt4 book ai didi

parsing - 您认为 Google 日历中的 "Quick Add"功能如何运作?

转载 作者:行者123 更新时间:2023-12-04 12:43:54 26 4
gpt4 key购买 nike

我正在考虑一个项目,该项目可能使用类似于“快速添加”如何将自然语言解析为可以通过某种语义级别理解的内容的功能。我有兴趣更好地理解这一点,并想知道您对如何实现这一点有何想法。

如果您不熟悉“快速添加”是什么,请查看 Google's KB关于它。

6/4/10 更新
关于“自然语言解析”(NLP)的额外研究产生的结果比我认为在“快速添加”之类的东西中实际实现的结果要广泛得多。鉴于此功能需要特定类型的输入而不是真正的自由格式文本,我认为这是 NLP 的一种更窄的实现。如果有人能建议我可以研究的更狭窄的主题,而不是 NLP 的整个范围,我将不胜感激。

也就是说,我找到了一个不错的 collection of resources about NLP包括这个伟大的 FAQ .

最佳答案

我将首先决定一种标准方式来表示我感兴趣的所有信息:事件名称、开始/结束时间(和日期)、客人名单、位置。例如,我可能会使用这样的 XML 表示法:

<event>
<name>meet Sam</name>
<starttime>16:30 07/06/2010</starttime>
<endtime>17:30 07/06/2010</endtime>
</event>

然后,我的目标是建立一个关于日期的日记条目的语料库,并用它们的 XML 形式进行注释。我将如何收集数据?好吧,如果我是谷歌,我可能会有各种各样的方法。既然我是我,我可能会先写下我能想到的所有表达这类东西的方式,然后手工注释。如果我可以通过浏览 friend 的电子邮件之类的方式对此进行补充,那就更好了。

现在我有了一个语料库,它可以作为一组单元测试。我需要编写一个解析器来适应测试。解析器应该将一串自然语言翻译成我的注释的逻辑形式。首先,它应该将字符串拆分为其组成词。这称为标记化,并且有现成的软件可以做到这一点。 (例如,参见 NLTK 。)为了解释这些词,我会在数据中寻找模式:例如,“at”或“in”后面的文本应该被标记为一个位置; “X 分钟”意味着我需要将该分钟数添加到开始时间以获得结束时间。统计方法在这里可能有点过头了 - 最好创建一系列手工编码的规则来表达您自己对如何解释该领域中的单词、短语和结构的知识。

关于parsing - 您认为 Google 日历中的 "Quick Add"功能如何运作?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2959458/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com