gpt4 book ai didi

Python Goose 无法提取日期

转载 作者:太空宇宙 更新时间:2023-11-03 11:53:49 25 4
gpt4 key购买 nike

我正在使用 Python Goose。您可以在 this link 中找到它

我想提取发布日期,但是当我运行:

g = Goose()
entity = g.extract(url="mylink")
date = entity.publish_date

结果是 None

我已经在许多网站上尝试过了,结果是 None

有什么建议吗?

最佳答案

我刚刚检查了来源的相关部分:crawler.pypublish_date 提取当前已被注释掉

# TODO
# article.publish_date = config.publishDateExtractor.extract(doc)

进一步检查表明,如果您取消注释上面的行,您将能够定义您的自定义日期提取器。但是,Goose 中没有实现默认的日期提取器。请参阅此方法:https://github.com/grangier/python-goose/blob/master/goose/configuration.py 中的 set_publishdate_extractor

关于Python Goose 无法提取日期,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18846540/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com