- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我的工作基本上是:
-在此网站中输入“https://aplicacoes.mds.gov.br/sagirmps/estrutura_fisica/preenchimento_municipio_cras_new1.php”
-填写 2 个表格(例如,使用 AC - Acre
和 Bujari
)
-点击生成的表格最后一列中的“Dados Detalhados”(详细数据)。 (当点击“Dados Detalhados”时,会生成第二个表,每行1个月的数据)。
- 单击每行最后一列的“Visualizar Relatório”,访问第二个表生成的数据。 <---- 这就是我正在尝试抓取的数据。但它是一个动态网站,我无法仅访问 url2
获取数据(当您单击“Visualizar relatório”时,网站返回到初始 url,但包含我想要抓取的表格) 。这是代码:
import requests
from bs4 import BeautifulSoup
import pandas as pd
url = 'http://aplicacoes.mds.gov.br/sagirmps/estrutura_fisica/preenchimento_municipio_cras_new1.php'
params ={
'uf_ibge': '12',
'nome_estado': 'AC - Acre'
'p_ibge': '1200138'
'nome_municipio': 'Bujari'
}
r = requests.post(url, params = params, verify = False)
soup = BeautifulSoup(r.text, "lxml")
tables = pd.read_html(r.text)
unidades = tables[1]
print(unidades)
url2 = 'http://aplicacoes.mds.gov.br/sagirmps/estrutura_fisica/rel_preenchidos_cras.php?&p_id_cras=12001301971'
params2 ={
'p_id_cras': '12001301971'
'mes_referencia': '2019-02-01'
}
r2 = requests.post(url2, json = params2, verify = False)
soup2 = BeautifulSoup(r2.text, 'lxml')
soup2
请注意,url2
是您点击“Dados Detalhados”时生成的 URL,它的第二个字典是“p_id_cras”。
params2
应该是用于抓取我正在谈论的数据的字典。我在第二个发布请求中尝试了命令 params
、data
和 json
,但它们都不起作用。
最佳答案
url2
应使用不带参数的 GET
。
然后你有一个带有表格的页面,其中的链接具有 href="javascript:"
还有 onclick='enviadados(12001301971,"2019-02-01")'
这样你就有了下一个请求的参数。
上次请求使用 POST
以及参数 12001301971,2019-02-01
和 url
https://aplicacoes.mds.gov.br/sagirmps/estrutura_fisica/visualiza_preenchimento_cras.php '`
我的代码。我希望它能正确工作。
import requests
from bs4 import BeautifulSoup
import pandas as pd
base = 'http://aplicacoes.mds.gov.br/sagirmps/estrutura_fisica/'
url = base + 'preenchimento_municipio_cras_new1.php'
#print('url:', url)
params ={
'uf_ibge': '12',
'nome_estado': 'AC - Acre',
'p_ibge': '1200138',
'nome_municipio': 'Bujari' ,
}
r = requests.post(url, params=params, verify=False)
soup1 = BeautifulSoup(r.text, "lxml")
tables = pd.read_html(r.text)
#unidades = tables[1]
#print(unidades)
all_td1 = soup1.find('table', class_="panel-body").find_all('td')
#print('len(all_td1):', len(all_td1))
for td1 in all_td1:
all_a1 = td1.find_all('a')[:1]
#print('len(all_a1):', len(all_a1))
for a1 in all_a1:
url = base + a1['href']
print('url:', url)
r = requests.get(url, verify=False)
soup2 = BeautifulSoup(r.text, "lxml")
#print(soup.text)
all_td2 = soup2.find('table', class_="panel-body").find_all('td')
#print('len(all_td2):', len(all_td2))
for td2 in all_td2:
all_a2 = td2.find_all('a')
#print('len(all_a2):', len(all_a2))
for a2 in all_a2:
print('onclick:', a2['onclick'])
params = {
'p_id_cras': a2['onclick'][11:22], #'12001301971',
'mes_referencia': a2['onclick'][24:-2], #'2019-02-01',
}
print(params)
url = 'https://aplicacoes.mds.gov.br/sagirmps/estrutura_fisica/visualiza_preenchimento_cras.php'
r = requests.post(url, params=params, verify=False)
soup = BeautifulSoup(r.text, "lxml")
all_table = soup.find_all('table')
print(all_table)
关于python - 如何在python 3中获取该站点中的json数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55540722/
最近我用 php 建立了一个网站,但他们的旧网站都是 HTML 格式的。所以现在我不知道使用 .htaccess 将所有这些旧链接重定向到新站点(可能将所有带有 HTML 的链接重定向到主域)的最佳方
我创建了一个新的 WordPress 网站,它是我旧网站的更名版本。它有一个新的域和一个新的设计。除此之外,其他一切都是相同的,包括内容和链接结构。现在我想完全重定向旧链接。与旧帖子一样,标签和类别
我想使用 WatiN测试我正在开发的网站的功能。理想情况下,我会在测试开始运行之前以编程方式部署网站 (asp.net MVC3),然后在每次测试之前刷新数据。这可能吗? 最佳答案 在此处阅读有关使用
我们的网站使用我们自己定制的 session 状态管理,与 ASP.NET session 状态分开。但是由于少数特殊页面使用 SQL Server Reporting Services,我们还需要启
不久前我看到一个网站,其中有 JavaScript/HTML/CSS 栏目,下面有实际代码的样子。有点像 jsFiddle,但它有用户示例和演示。有谁知道这个网站的名字吗?我到处都找不到它!谢谢! 最
我们的核心数据库出现问题,该数据库已由前一天的备份数据库恢复。 此后,网站工作正常,但我们在发布任何更改时遇到问题。一旦点击发布按钮,“发布正在初始化..”消息就会持续很长时间。截至“发布开始/结束”
我们的核心数据库出现问题,该数据库已由前一天的备份数据库恢复。 此后,网站工作正常,但我们在发布任何更改时遇到问题。一旦点击发布按钮,“发布正在初始化..”消息就会持续很长时间。截至“发布开始/结束”
Maven 不仅仅是一款项目构建和依赖管理工具,它还能够聚合项目信息,促进项目团队间地交流。POM 中可以包含各种项目信息,例如:项目描述、SCM 地址、许可证信息,开发者信息等。用户可以使用 Mav
关闭。这个问题需要更多focused .它目前不接受答案。 想改进这个问题吗? 更新问题,使其只关注一个问题 editing this post . 关闭上个月。 Improve this ques
您知道哪些网站正在使用 Silverlight?此信息将帮助我们决定何时采用 Silverlight 平台。 这些网站应该是面向公众的并且被认为是高流量的。 (每月至少 300,000 次点击)。 我
我尝试通过 VS2017 中的发布上下文菜单将我的 .net 核心站点部署到 Azure,偶尔(大约三分之一的部署),我收到以下错误。 Web deployment task failed. (Web
我为 20 个不同的国家/地区创建了一个包含 20 个站点(每个站点一个不同的域)的 Django 项目。这些站点共享所有内容:代码库、数据库、网址、模板等。 他们唯一不共享的是我在每个站点设置文件中
如何将商店页面添加到我使用 jekyll 和基础构建的网站? 任何自动化平台/方法都可以做到这一点。 谢谢。 最佳答案 您可以使用 snipcart .有一个blog post和一个 demo sit
我部署了一个服务结构集群,域为 foo.northcentralus.cloudapp.azure.com 它具有单一节点类型和单一公共(public) IP 地址/负载均衡器。 假设我部署了以下
我不是一个大的typ3 专家,也无法访问我正在使用的typ3 实例中的typoscript 选项(这是一个非常大的站点,我没有这样做的授权)。所以我希望这个问题适合 stackoverflow(如果没
我们正在对我们的 Drupal 站点进行性能调整。 我们正在使用 Siege 来衡量性能(作为 drupal 访问者)。 环境: Nginx + FastCGI + Memcache Siege 运行
我搜索了 SO、SU 和 SP.SE寻求解决方案,但找不到我需要的东西。我正在寻找一个解决方案,它可能是一个脚本或一些其他非编码方法/工具。 我正在尝试编写一个脚本(供其他人使用)或某种其他形式的自动
我有一个 Django 站点,它使用本地化中间件与 gettext 和 trans/blocktrans 模板标签相结合,根据用户代理字符串中的首选语言向访问者显示不同的页面(这似乎是在 Django
我是 Drupal 新手。是否可以设置所有内容并在服务器上部署 Drupal?我的意思是像放入内容、设置模块等...,然后将它们全部放到生产服务器上? 最佳答案 当然。 复制所有文件 编辑数据库凭证(
我想将以下行添加到我的 head.html仅在运行时 jekyll serve本地: 如果可能的话,我正在考虑使用一些简单的液体检查。 最佳答案 当你做 jekyll serve本地默认 {{
我是一名优秀的程序员,十分优秀!