spacy - 我的问题是关于 "module ' textacy' has no attribute 'Doc' "-6ren

spacy - 我的问题是关于 "module ' textacy' has no attribute 'Doc' "

转载作者：行者123 更新时间：2023-12-04 01:42:39

24

4

找不到模块'textacy'没有属性'Doc'
我正在尝试从 spacy 中提取动词短语，但没有这样的库。请帮助我如何使用 spacy 提取动词短语或形容词短语。我想做完整的浅解析。

def extract_named_nouns(row_series):
    """Combine nouns and non-numerical entities. 

    Keyword arguments:
    row_series -- a Pandas Series object

    """
    ents = set()
    idxs = set()
    # remove duplicates and merge two lists together
    for noun_tuple in row_series['nouns']:
        for named_ents_tuple in row_series['named_ents']:
            if noun_tuple[1] == named_ents_tuple[1]: 
                idxs.add(noun_tuple[1])
                ents.add(named_ents_tuple)
        if noun_tuple[1] not in idxs:
            ents.add(noun_tuple)

    return sorted(list(ents), key=lambda x: x[1])

def add_named_nouns(df):
    """Create new column in data frame with nouns and named ents.

    Keyword arguments:
    df -- a dataframe object

    """
    df['named_nouns'] = df.apply(extract_named_nouns, axis=1)


    from __future__ import unicode_literals
    import spacy,en_core_web_sm
    import textacy
    from textacy import io
    #using spacy for nlp
    nlp = en_core_web_sm.load()
    sentence = 'The author is writing a new book.'
    pattern = r'<VERB>?<ADV>*<VERB>+'
    doc = textacy.Doc.load(sentence, metadata=metadata, lang='en_core_web_sm')
    # doc = textacy.corpus.Corpus(sentence, lang='en_core_web_sm')
    lists = textacy.extract.pos_regex_matches(doc, pattern)
    for list in lists: 
        print(list.text)

模块'textacy'没有属性'Doc'

最佳答案

尝试按照此处的示例进行操作:https://chartbeat-labs.github.io/textacy/getting_started/quickstart.html#make-a-doc

它应该很简单:

doc = textacy.make_spacy_doc("The author is writing a new book.", lang='en_core_web_sm')

您可能会考虑只使用带有内置 Matcher 的 spacy(没有 textacy)( https://spacy.io/usage/rule-based-matching )。

关于spacy - 我的问题是关于 "module ' textacy' has no attribute 'Doc' "，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/56720269/

24

4

0

文章推荐： oracle - dbms_scheduler 创建作业未运行作业

文章推荐： ethereum - 如何从 Metamask 获取帐户地址？

c# - 为什么 "test user-doc.doc"==> TESTUS~1.DOC？
我编写了一个 c# 程序，并在未安装 MS-Office 的 PC 中将其与文件扩展名(如 DOC)相关联。然后，我双击名称中包含空白字符的任何文件，我的程序将启动以打开该文件。我使用了以下语句: s
google-docs - 如何使用 Google Docs API 编辑 Google Docs 标题？
我试过创建、批量更新、从 https://developers.google.com/docs/api/how-tos/overview 获取. 即使在 batchUpdate 中，我也看不到编辑 t
linux - 在 Linux 中运行 ls doc*.txt 和 ls doc?*.txt 和 ls doc*?.txt 有什么不同？
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。这个问题似乎不是关于 a specific programming problem, a softwar
google-docs - Google Docs API - 更新链接表格
我正在尝试使用新 API 更新 Google 文档中的表格。表格链接自 Google 表格。我尝试了谷歌云中的 API 资源管理器。我能够以 json 格式提取文档，然后过滤出表格。但是在表 jso
google-docs - Google Docs API - 模拟用户文件下载
将 Google Docs Java API 与 Google Apps 帐户一起使用，是否可以模拟用户并下载文件？当我运行下面的程序时，它显然是登录到域并冒充用户，因为它检索其中一个文件的详细信息
api-doc - 如何在 api-doc 中设置数组响应？
我试图通过 apidoc 生成 API 文档如果我的回应是一个数组 [ {"id" : 1, "name" : "John"}, {"id" : 2, "name" : "Mary"}
google-docs-api - 无需身份验证的 Google Docs API
是否可以在没有身份验证的情况下在 Google Docs 中查询公开共享的用户文档？我正在寻找的特定最终目标是能够提供用户 ID，然后列出所有公开共享的文档，并在集合中带有特定标记。谢谢。最佳答
elasticsearch - 在elasticsearch中，/doc/_mapping和/doc {“mappings”之间有什么区别……}
我对Elasticsearch映射感到困惑首先，我创建了一个带有映射请求的文档 PUT /person { "mappings":{ "properties":{ "firs
google-docs - Google Doc Query 在一张表中工作，但在另一张表中给出解析错误
我有一个可在一个电子表格中运行的 Google 文档查询。但是，当我复制电子表格时，查询不起作用，并且收到解析错误:无法解析函数 QUERY 参数 2 的查询字符串:NO_COLUMNCol2。我的
java - 如何使用现有 XML DOC 的属性创建新的 XML DOC？
我有一个如下所示的 XML 文档: _1 _2 TASK _3 TASK 我必须使用第一个文档中的节点属性创建另一
read-the-docs - 如何找到 Read-the-docs 项目的 PDF 版本
我没有看到什么？ RTD features页面说: PDF Generation When you build your project on RTD, we automatically build
google-docs - 嵌入式 Google Docs PDF 查看器显示登录页面而不是 PDF
我有一个网页，我在 iFrame 中嵌入了一个 Google 文档查看器 (其中 URL-encoded-URL 是实际编码的 URL)。对于我的许多/大多数用户，Google PDF 文档查看器
google-docs - 在 asp.net 应用程序中使用 google docs
我如何在我的项目中使用 GOOGLE DOCS，我正在使用 asp.net 和 C# 作为后面的代码。基本上我需要在浏览器中以只读形式显示一些 pdf、doc、dox、excel 文档。提前致谢
google-docs-api - 如何使用 Google Docs API 缩进项目符号列表
从看起来像的 Google Doc 开始: * Item 我希望进行一系列 API 调用以将文档转换为: * Item - Subitem 但是，我不知道如何使用 API 做到这一点。 Crea
google-docs - 使用 JavaScript 控制 Google Docs 嵌入式查看器
我需要控制我网站中嵌入的 Google 文档查看器。更具体地说，我需要能够启用/禁用 Google 幻灯片 View 的控件，并能够使用 JavaScript 启动/停止演示文稿。我无法为此找到任何
google-docs - 如何使用 Google Docs API 添加页眉/页脚
我想使用 Google Docs API 将页眉和页脚添加到现有的 Google 文档文件中. 看着documents.batchUpdate ( link ) 我们可以插入文本、替换文本、添加图像和
google-docs - 监控 Google Docs 上的 View 统计信息
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。这个问题似乎与 help center 中定义的范围内的编程无关。 . 已关闭 4 年前。 Improve
javascript - docs 文件夹中的 GitHub Pages 引用 docs 文件夹外部的文件
我已按照 GitHub 的文档进行操作，并使用 docs 成功发布了我的项目页面。我的项目存储库下的文件夹。但我想知道如何解决这个小问题: 我正在开发一个 JavaScript 库 wesa.js ，
java - 无法通过 Docs API 向新的 Google Doc 添加文本
我的程序正在创建文档，每个文档都有需要放入其中的文本。任何调用 InsertTextRequest 的尝试调用错误。 List requests = new ArrayList<>(); reques
如果 doc 的关键字发生变化，则 MySQL 会触发 doc 的更新时间戳
基于此: Set field to automatically insert time-stamp on UPDATE? 我正在尝试创建适合我需要的触发器，但我发现使用 OLD 和 NEW 关键字不方

首页

博学

6Ren·AI

商城

spacy - 我的问题是关于 "module ' textacy' has no attribute 'Doc' "