gpt4 book ai didi

asp.net - Python/web scrape/aspx——在没有表格的情况下,人为可能吗?

转载 作者:太空狗 更新时间:2023-10-30 00:57:13 24 4
gpt4 key购买 nike

显然,完全菜鸟。为了公开记录/政府透明度/报告/等,自学用于网络抓取的 Python。

我想抓取一个 .aspx 页面,一个 2012 年 1 月至 2012 年 3 月的每周日历

但它没有形式......

也许你们这些优秀的人可以在我花几天时间与它抗争之前告诉我是否有可能的解决方案。

http://webmail.legis.ga.gov/Calendar/default.aspx?chamber=house

查看日历上约会的唯一方法是在日历图片上选择一天。但是,至少,如果您单击星期一,它会显示该周的所有约会。 (我想收集所有这些任命,以计算每个委员会开会的频率,作为计算哪些立法受到关注以及哪些立法被忽略的代理。)

但是,使用什么策略呢?似乎每个月至少在它的内部都被分配给一个连续的四位数字,前面有一个“V”,比如 V4414,还有一个没有前缀的数字。

我只在 2012 年 1 月至 3 月期间狩猎;其他月份是非相关的,而且大多是空的。

线索?

    ...<a href="javascript:__doPostBack('calMain','V4414')" style="color:#333333" title="Go to the previous month">February</a></td><td align="center" style="width:70%;">March 2012</td><td align="right" valign="bottom" style="color:#333333;font-size:8pt;font-weight:bold;width:15%;"><a href="javascript:__doPostBack('calMain','V4474')" style="color:#333333" title="Go to the next month">April</a></td></tr> 

一个模式?

    ...<td align="center" style="color:#999999;width:14%;"><a      href="javascript:__doPostBack('calMain','4439')" style="color:#999999" title="February 26">26</a></td><td align="center" style="color:#999999;width:14%;"><a href="javascript:__doPostBack('calMain','4440')" style="color:#999999" title="February 27">27</a></td><td align="center" style="color:#999999;width:14%;"><a href="javascript:__doPostBack('calMain','4441')" style="color:#999999" title="February 28">28</a></td>...

干杯,谢谢!

最佳答案

表单包含四个输入名称为:

  • __EVENTTARGET
  • __EVENTARGUMENT
  • __VIEWSTATE
  • __EVENTVALIDATION

后两者有初始值。你需要刮掉那些。前两个由这些链接设置。例如,您有一个链接:

<a href="javascript:__doPostBack('calMain','4504')" style="color:Black" title="May 01">1</a>

查看href:

javascript:__doPostBack('calMain','4504')

以某种方式从中解析出这两个字符串。前者是 __EVENTTARGET。后者是 __EVENTARGUMENT

一旦您获得了全部四段数据,您就可以发出 POST 请求以获取下一页。

关于asp.net - Python/web scrape/aspx——在没有表格的情况下,人为可能吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10442175/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com