python - 你如何使用 nltk.util.breadth

python - 你如何使用 nltk.util.breadth_first 来搜索？

转载作者：太空宇宙更新时间：2023-11-03 10:51:42

24

4

我正在尝试使用 breadth_first 搜索(首先)特定的叶词，然后在 ParentedTree 中搜索特定的标签 (NP)。如果已经有一个方法，我真的宁愿不自己实现它。这是我尝试过的方法(包括我如何制作树，以防那是我搞砸的地方):

import nltk
from nltk.util import breadth_first

grammar = nltk.data.load("/path/to/grammar.cfg")
parser = nltk.parse.EarleyChartParser(grammar)
sent = "They are happy people"
parse1 = list(parser.parse(sent.split()))
tree1 = nltk.tree.ParentedTree.convert(parse1[0])
bf = breadth_first(tree1)

这给了我一个生成器对象，但我不确定如何使用它来搜索我想要的东西(代词“他们”)。我尝试做一个简单的“for node in bf: print(node)”，它将字符串的每个字母单独打印在一行上，永远重复，直到我不得不关闭窗口。

我已阅读文档并进行了大量谷歌搜索，但找不到实际用于搜索的示例。我究竟做错了什么？

最佳答案

nltk.util.breadth_first 方法对您作为参数提供的树进行广度优先遍历。要将其用作搜索机制，您需要检查生成器返回的每个结果中的值。

如果您遍历 breadth_first 返回的生成器的结果并在遍历的每一步输出结果，您可以看到它遇到树中的每个节点(按 BFS 顺序)，最终遇到叶节点和字符节点树也是如此。

因此，对于您的情况，您希望使用此生成器并在每个节点检查一些值，以查看您是否已到达具有您在搜索中寻找的符号或叶 token 的节点。

这是一个示例句子，它来自 nltk 的解析树，以及对树的遍历。

祝你好运!

>>> sentence
'They capture mice in the cells'
>>> parse
Tree('S', [Tree('NP', [Tree('PRP', ['They'])]), Tree('VP', [Tree('VBP', ['capture']), Tree('NP', [Tree('Nom', [Tree('Nom', [Tree('NNS', ['mice'])]), Tree('PP', [Tree('Prep', ['in']), Tree('NP', [Tree('Det', ['the']), Tree('Nom', [Tree('NNS', ['cells'])])])])])])])])
>>> i = 0
>>> for node in breadth_first(parse):
...     print("*"*10)
...     print(node)
...     print(type(node))
...     if i > 10:
...             break
...     i += 1
...
**********
(S
  (NP (PRP They))
  (VP
    (VBP capture)
    (NP
      (Nom
        (Nom (NNS mice))
        (PP (Prep in) (NP (Det the) (Nom (NNS cells))))))))
<class 'nltk.tree.Tree'>
**********
(NP (PRP They))
<class 'nltk.tree.Tree'>
**********
(VP
  (VBP capture)
  (NP
    (Nom
      (Nom (NNS mice))
      (PP (Prep in) (NP (Det the) (Nom (NNS cells)))))))
<class 'nltk.tree.Tree'>
**********
(PRP They)
<class 'nltk.tree.Tree'>
**********
(VBP capture)
<class 'nltk.tree.Tree'>
**********
(NP
  (Nom
    (Nom (NNS mice))
    (PP (Prep in) (NP (Det the) (Nom (NNS cells))))))
<class 'nltk.tree.Tree'>
**********
They
<class 'str'>
**********
capture
<class 'str'>
**********
(Nom
  (Nom (NNS mice))
  (PP (Prep in) (NP (Det the) (Nom (NNS cells)))))
<class 'nltk.tree.Tree'>
**********
T
<class 'str'>
**********
h
<class 'str'>
**********
e
<class 'str'>

关于python - 你如何使用 nltk.util.breadth_first 来搜索？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/49161277/

24

4

0

文章推荐： c# - 从文件加载参数？

文章推荐： C# 正则表达式 : How to break up plain text string

文章推荐： android - 版本控制 Android/Eclipse 项目及其所有第 3 方库

文章推荐： php - 为什么我的第一个 PHP 类没有按预期工作？

c# - Google.Apis.Util.Utilities.GetStringValue(System.Enum) 和 Google.Apis.Util.Utilities.GetStringValue(System.Enum) 之间的调用不明确
我在这个网站上发布的代码有这个问题 https://developers.google.com/drive/quickstart-cs是 Google Drive 快速入门的开发人员站点。我按照网站上
java - Kafka Utils 类路径错误 : org. apache.kafka.common.utils.Utils
我正在尝试制作一个非常简单的 Kafka Producer，目前正在关注 producer example除了我的制作人没有分区程序类。将所需文件导出到 jar 后，我将它们传输到我的 Linux
java - 当使用外部模拟 util 库(也使用 java util lib)测试 java util 库时的循环引用
问题在java中，我有一个“Util项目”，在进行单元测试时使用另一个“Mock项目”。我的问题是“模拟项目”也使用“Util项目”来构建一些模拟对象。当我使用 Maven 构建项目时，我无法构
scala - 真的需要 scala.util.automata、scala.util.regexp 和 scala.util.grammar 吗？
据我所知，这些包已经存在很长时间了。但是，我从未见过它们的实际用法。而且这些包似乎不成熟，不再维护。如果是，为什么这些包现在存在？最佳答案包裹automata被 scala.xml.dtd 使用,
android - 无法下载 backport-util-concurrent.jar(backport-util-concurrent :backport-util-concurrent:3. 1):没有可用于离线模式的缓存版本
关闭。这个问题需要debugging details .它目前不接受答案。想改进这个问题？将问题更新为 on-topic对于堆栈溢出。 1年前关闭。 Improve this question Co
java - 为什么在 java.util.Collections 中声明静态 java.util.Collections.fill() 方法而不是在 java.util.AbstractList 中声明实例方法？
在java.util.Collections中，有一个方法: public static void fill(List list, T obj) 用第二个参数指定的对象填充第一个参数指定的List。
scala - 类型不匹配;找到 : edu. stanford.nlp.util.CoreMap => 需要单位 : java. util.function.Consumer[_> : edu. stanford.nlp.util.CoreMap]
我不明白它要我做什么。分配给 sentence正在工作: val sentences : java.util.List[CoreMap] = document.get(classOf[Sentence
javascript - util 函数直接导出 vs util 类
在我的 React 应用程序中，我想使用一些实用程序。我见过两种不同的方法。第一个是，只是创建函数并将其导出。第二个是，创建一个 Util 类并导出一个对象，这样它就不能被实例化(静态类)。 clas
java - 如何对依赖于其他 Util 类方法的 Util 类进行单元测试？
我有一个 util 类，它接受 String jwtToken 和 Key key 并使用 io.jsonwebtoken.jwts 解码 jwt。但是，我无法对此进行测试。原因是，我无法模拟公钥并
java - 目标命名空间java util cxf和代码生成包java.util.xsd
我有使用目标命名空间的专有架构 xmlns:ax216="http://util.java/xsd" 这给我带来了从 java (java.util.xsd) 开始生成禁止的(由 Java 安全管理器
java - java.util.Collections和java.util.Collection在Java中有什么关系吗？
我正在阅读集合以查看 Javadocs 中的实现层次结构。 Collections声明为public class Collections extendds Object Collection声明为pu
java - 无法将 'config.map' 下的属性绑定(bind)到 java.util.Map>> :
我正在使用 Spring-boot 应用程序，我可以在其中连接 Azure 应用程序配置。但是当我尝试使用内容类型应用程序/JSON 读取值时出现错误。我的Java类 @ConfigurationP
java - 无法将 'config.map' 下的属性绑定(bind)到 java.util.Map>> :
我正在使用 Spring-boot 应用程序，我可以在其中连接 Azure 应用程序配置。但是当我尝试使用内容类型应用程序/JSON 读取值时出现错误。我的Java类 @ConfigurationP
java.util.IllegalFormatConversionException 与 java.util.Formatter
我在使用格式说明符时遇到问题。这是否意味着我正在使用 %d？ public static void main(String[] args) { double y, x; for (x =
java.util.Iterator 但无法导入 java.util.Iterator
鉴于此代码 import java.util.Iterator; private static List someList = new ArrayList(); public static void
java.util.Scanner 处的 java.util.NoSuchElementException
我正在 HackerEarth 解决问题，我无法弄清楚为什么我的程序在命令行上正确运行并给出正确的结果，但在代码编辑器上运行时却给出 java.util.NoSuchElementException
java.util.ArrayList 无法转换为 java.util.Vector
我正在尝试使用以下代码使用对象列表列表中的数据填充tableModel readExcel.readSheet(0): TableModel tableModel = new DefaultTabl
java.util.Set、java.util.List 可序列化问题
java.util.Set 、 java.util.List 和其他 Collection 接口(interface)不可序列化。需要一个简单、直接的解决方案来在可序列化的 POJO 中使用它。 pu
java.util.Vector 无法转换为 java.util.ArrayList
我试图从 servlet 返回数据库搜索结果的 ArrayList 以显示在 jsp 页面上。在servlet中设置arraylist作为请求的属性，并将请求转发到jsp页面。当我尝试在 jsp 页
java.util.HashMap 无法转换为 java.util.ArrayList
我是android新手，最近我试图从firebase中提取数据到recyclerview/cardview中以垂直布局显示数据，它显示将Hashmap转换为Arraylist的错误，其中代码是:

首页

博学

6Ren·AI

商城

python - 你如何使用 nltk.util.breadth_first 来搜索？