gpt4 book ai didi

javascript - 使用 python 抓取 dechtech 网站

转载 作者:行者123 更新时间:2023-12-02 19:18:02 28 4
gpt4 key购买 nike

我正在寻找一种从该网站抓取数据的方法:http://www.dectech.org/football/index.php最好使用Python。我似乎遇到的困难是数据没有硬编码到网站的 HTML 中,并且似乎被包装在称为 mochi-kit ( http://mochi.github.com/mochikit/ ) 的东西中。

我做了一些研究,似乎像 BeautifulSoup 这样的东西可能对我有用,但我认为我可能没有正确使用它。我还尝试过使用 urllib 来解析网站,但没有任何乐趣。

我的最终目标是拥有一个程序来监控 dectech 网站,并在发布新预测时,使用 Betfair API 自动挑选值(value)投注。

最佳答案

看起来数据正在由 javascript 从此 url 加载

http://www.dectech.org/cgi-bin/new_site/GetUpcomingGames.pl?divID=0

返回

{
"games" : [
{
"apct" : 0.377838,
"dpct" : 0.263445,
"expGoalDiff" : -0.04086,
"awayID" : "6",
"homeID" : "17",
"date" : "20/10/2012",
"away" : "Chelsea",
"home" : "Tottenham",
"hpct" : 0.358717
},
{
"apct" : 0.237829,
"dpct" : 0.250146,
"expGoalDiff" : 0.594234,
"awayID" : "1",
"homeID" : "8",
"date" : "20/10/2012",
"away" : "Aston Villa",
"home" : "Fulham",
"hpct" : 0.512025
}, /* shortened for brevity */

所以你非常幸运,你不需要抓取数据(这很棘手),你只需要检索它并解析它,就像他们对 mochi 所做的那样。

Python 的 simplejson模块将能够解析它...

关于javascript - 使用 python 抓取 dechtech 网站,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12896075/

28 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com