gpt4 book ai didi

python - 如何使用 python-goose 获取文章的作者

转载 作者:行者123 更新时间:2023-12-01 05:27:17 27 4
gpt4 key购买 nike

我正在尝试从新闻机构抓取文章,但我不知道如何使用 python-goose 获取文章的作者。我已经阅读了文档、源代码并搜索了 google。

from goose import Goose

def getArticle(url):
g = Goose()
article = g.extract(url=url)
print article.title
# print article.author
# print article.writer

那么,是否有一种内置方法可以使用 python-goose 提取文章的作者?

python-goose 代码和文档的链接:http://github.com/grangier/python-goose

最佳答案

来自their documentation :

Goose will try to extract the following information:

  • Main text of an article
  • Main image of article
  • Any Youtube/Vimeo movies embedded in article
  • Meta Description
  • Meta tags

他们不 promise 找到作者;您将需要查看元数据以查看是否包含它并手动提取它。

关于python - 如何使用 python-goose 获取文章的作者,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21079015/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com