gpt4 book ai didi

Python Webscrape 通过 Scrapy 或 Excel 查询搜索?

转载 作者:太空宇宙 更新时间:2023-11-03 21:40:49 24 4
gpt4 key购买 nike

我的问题涉及发现通过 Scrapy 执行 Python Webscrape 的整体效率,而不是通过 Microsoft Excel 简单执行 Web 查询搜索来执行特定任务。

我想做的是自动从 NFL 网站提取数据。例如, http://www.nfl.com/stats/categorystats?tabSeq=2&offensiveStatisticCategory=GAME_STATS&conference=ALL&role=TM&season=2018&seasonType=REG&d-447263-s=TOTAL_YARDS_GAME_AVG&d-447263-o=2&d-447263-n=1

例如,每周提取 NFL 进攻排名。我知道我可以简单地将信息复制并粘贴到 Excel 电子表格中,但这不是我想要做的。我正在尝试找到一种使该过程自动化的方法,这样我就不必自己手动完成。

当通过 Scrapy 使用 Python Webscrape 时,面临的挑战是开发能够获取我正在寻找的所有信息的代码。如果 Microsoft Query 搜索是更好的选择,是否值得开发代码?

理想情况下,我的总体目标是每周通过 Scrapy 使用 Python Webscrape 或 Microsoft Excel 提取数据,这样我就不必自己手动完成。其中包括从多个外部源提取数据并将其保存到一个文件中。例如,NFL Offense、NFL Offense Passing、NLF Defense Rush 等。我只需运行程序或打开 Excel 电子表格,就会出现一个包含更新数据的新工作表(或创建一个新的 Excel 文件),然后我可以继续进行数据分析。

任何想法或意见将不胜感激!

最佳答案

如果我理解正确的话,你想抓取网站。

如果您熟悉 Python,我建议使用 beautiful soup package 。它可能是网页抓取的首选框架,您只需识别要抓取的 HTML 标签即可。它还将有助于循环浏览页面。

有很多像this one这样的教程这可以帮助您了解如何解决您的问题。

希望这有帮助!

关于Python Webscrape 通过 Scrapy 或 Excel 查询搜索?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52875938/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com