gpt4 book ai didi

Python Goose 无法提取 mashable/usatoday/politicalwire 文章

转载 作者:行者123 更新时间:2023-12-01 05:25:37 36 4
gpt4 key购买 nike

我正在使用 python goose extractor,但 mashable.com 和 usatoday.com 上的每篇文章都失败了。有人可以建议解决该问题吗?

对于 usatoday.com 文章:

g = Goose()
article = g.extract(url='http://www.usatoday.com/story/tech/columnist/talkingtech/2014/01/25/namm-2014---ik-multimedias-rings-to-make-music/4863193/')
assert(article.cleaned_text=='')

对于可混搭的文章:

g = Goose()
article = g.extract(url='http://mashable.com/2014/01/26/square-cofounder-jim-mckelvey/')
assert(article.cleaned_text=='')

对于政治线文章:

g = Goose()
article = g.extract(url='http://politicalwire.com/archives/2014/01/27/some_republicans_go_off_script_in_sotu_response.html')
assert(article.cleaned_text=='')

我认为这些是文本提取非常重要的网站。有人可以建议修复吗?谢谢

最佳答案

最新版本的 Goose 来自 here能够从 usatoday.com 和 mashable.com 提取

关于Python Goose 无法提取 mashable/usatoday/politicalwire 文章,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21397893/

36 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com