- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在尝试将以下网站抓取到包含所有议员候选人(按政党和地区划分)的 csv 文件中:
https://www.eleicoes.mai.gov.pt/legislativas2005/be_ftp.html#viana
我已经成功创建了一个循环来遍历每一方的不同网址。现在,我想要的是刮掉所有名称标签,这样每个标签都有关联的地区 - <td class="ligacoes">
和/或<span class="ligacoes">
- 和派对 - <td class="ligacoes">
- 在最终的 csv 文件中,在每个候选人的前面。
我正在努力编写一个循环来按照我的意愿组织数据 - 最终的 csv 应该包含三列,分别是候选人的姓名、选区和政党。此外,<td>
和<span>
标签有一些重叠的信息(Beja、Braga、Bragança 和 Coimbra 都在两个标签中),我也不确定如何处理它。
任何建议和/或有用的链接将不胜感激。
url = 'https://www.eleicoes.mai.gov.pt/legislativas2005/be_ftp.html#'
uClient = urlopen(url)
list2 =['be', 'cdu', 'cds', 'ph', 'pnd', 'pnr', 'pctp', 'pous', 'pda', 'psd', 'ps']
c = soup.findAll("td", {"class": "bckgrd"}) #candidate and position tags
d1 = soup.findAll("td", {"class": "ligacoes"}) #districts 1
d2 = soup.findAll("span", {"class": "ligacoes"}) #districts 2
# sobreposição de Beja, Braga, Bragança e Coimbra
for i in list2:
url = 'https://www.eleicoes.mai.gov.pt/legislativas2005/{}_ftp.html#'.format(i)
r = requests.get(url)
soup = BeautifulSoup(r.content, "html.parser")
print(soup)
#code by page
最佳答案
您可以获得相关的tr
实体并使用生成器:
from bs4 import BeautifulSoup as soup
import requests, itertools as it
def get_page(district):
d = list(filter(lambda x:x != '\n', soup(requests.get(f'https://www.eleicoes.mai.gov.pt/legislativas2005/{district}_ftp.html#viana').text, 'html.parser').table.contents))[7:-2]
new_d, last, c = [[i.find('td', {'class':'ligacoes'}), [[k.text for k in b.find_all('td')] for b in i.find_all('tr', {'valign':'bottom'})]] for i in d], None, []
for a, b in new_d:
if a is None:
c.extend([j for _, j in b])
elif last is None:
last = a.text
c.extend([j for _, j in b])
else:
yield {'name':last, 'vals':c}
last, c = a.text, [j for _, j in b]
yield {'name':last, 'vals':c}
result = [{'name':i, 'party':'be', 'district':k['name']} for k in get_page('be') for i in k['vals']]
输出:
[{'name': 'Lúcia de Fátima Oliveira Arruda', 'party': 'be', 'district': '-Açores'}, {'name': 'Maria de Fátima Diniz Drumond', 'party': 'be', 'district': '-Açores'}, {'name': 'Mário Manuel de Castro Moniz', 'party': 'be', 'district': '-Açores'}, {'name': 'Mário Miguel Ferreira Lopes', 'party': 'be', 'district': '-Açores'}, {'name': 'Delfina Maria Cosme Soares', 'party': 'be', 'district': '-Açores'}, {'name': 'Eugénio Paulo \r\n Martins Viana', 'party': 'be', 'district': '-Açores'}, {'name': 'Eulália Maria \r\n Santos Bendito', 'party': 'be', 'district': '-Açores'}, {'name': 'Andrea Luis Valente Rodrigues de Castro Peniche', 'party': 'be', 'district': '-Aveiro'}, {'name': 'Pedro Filipe Gomes Soares', 'party': 'be', 'district': '-Aveiro'}, {'name': 'António de Oliveira e Silva', 'party': 'be', 'district': '-Aveiro'}, {'name': 'Patrícia Carla Flor Veiros', 'party': 'be', 'district': '-Aveiro'}, {'name': 'António José Nunes Teixeira Lopes', 'party': 'be', 'district': '-Aveiro'}, {'name': 'Paula Jorge Matos de Barros', 'party': 'be', 'district': '-Aveiro'}, {'name': 'Rui Jorge de Lima Moreira', 'party': 'be', 'district': '-Aveiro'}, {'name': 'Eva Maria Braga da Silva', 'party': 'be', 'district': '-Aveiro'}, {'name': 'Vitor Manuel Aguiar Gomes', 'party': 'be', 'district': '-Aveiro'}, {'name': 'Maria do Carmo de Pinho Marques', 'party': 'be', 'district': '-Aveiro'}, {'name': 'Vanda Maria Seiça Neves Cruzeiro', 'party': 'be', 'district': '-Aveiro'}, {'name': 'Vitor Manuel Coelho Valente', 'party': 'be', 'district': '-Aveiro'}, {'name': 'Saudade Maria Martins Manso Preto Teixeira Lopes', 'party': 'be', 'district': '-Aveiro'}, {'name': 'José Carlos Gomes Lopes', 'party': 'be', 'district': '-Aveiro'}, {'name': 'Nuno Filipe Barreiras Pereira Pinto', 'party': 'be', 'district': '-Aveiro'}, {'name': 'Carlos Alberto da Silva Veiros', 'party': 'be', 'district': '-Aveiro'}, {'name': 'José António Brandão Santos', 'party': 'be', 'district': '-Aveiro'}, {'name': 'Maria de Fátima Peixoto', 'party': 'be', 'district': '-Aveiro'}, {'name': 'Lino Manuel Teixeira de Jesus', 'party': 'be', 'district': '-Aveiro'}, {'name': 'Fernando Manuel Coelho de Sousa', 'party': 'be', 'district': '-Aveiro'}, {'name': 'Cláudio Figueiredo Torres', 'party': 'be', 'district': '-Beja'}, {'name': 'Lucinda Andrade Elias Correia Pito Simões', 'party': 'be', 'district': '-Beja'}, {'name': 'Guida Maria de Jesus Ascenção', 'party': 'be', 'district': '-Beja'}, {'name': 'António José Martins Guerreiro', 'party': 'be', 'district': '-Beja'}, {'name': 'Maria Cristina Martins Lopes', 'party': 'be', 'district': '-Beja'}, {'name': 'Aurelina Florinda de Freitas Rodrigues Lima', 'party': 'be', 'district': '-Beja'}, {'name': 'Pedro Manuel Bastos Rodrigues Soares', 'party': 'be', 'district': '-Braga'}, {'name': 'José Maria Barbosa Cardoso', 'party': 'be', 'district': '-Braga'}, {'name': 'Maria Manuela Barreto Nunes', 'party': 'be', 'district': '-Braga'}, {'name': 'José Carlos Sampaio Fonseca', 'party': 'be', 'district': '-Braga'}, {'name': 'Adelino Martins Mota', 'party': 'be', 'district': '-Braga'}, {'name': 'Maria Custódia Jorge da Rocha', 'party': 'be', 'district': '-Braga'}, {'name': 'António Meireles de Magalhães Lima', 'party': 'be', 'district': '-Braga'}, {'name': 'João Manuel Machado Oliveira', 'party': 'be', 'district': '-Braga'}, {'name': 'Maria João Martins Alves Botelho', 'party': 'be', 'district': '-Braga'}, {'name': 'José Manuel Vieira Faria', 'party': 'be', 'district': '-Braga'}, {'name': 'Manuel Fernandes da Cunha', 'party': 'be', 'district': '-Braga'}, {'name': 'Lisete Carina dos Santos Alvelos', 'party': 'be', 'district': '-Braga'}, {'name': 'José Carlos Magalhães da Costa Santos', 'party': 'be', 'district': '-Braga'}, {'name': 'Sérgio Adriano Fernandes Lopes', 'party': 'be', 'district': '-Braga'}, {'name': 'Maria Manuela Ferreira Ramos Monteiro', 'party': 'be', 'district': '-Braga'}, {'name': 'Custódio Manuel de Oliveira Braga', 'party': 'be', 'district': '-Braga'}, {'name': 'Mário Jorge Marques da Cunha Pinto Teixeira', 'party': 'be', 'district': '-Braga'}, {'name': 'Helena Maria Oliveira Gonçalves', 'party': 'be', 'district': '-Braga'}, {'name': 'Manuel António Teixeira da Silva', 'party': 'be', 'district': '-Braga'}, {'name': 'Andreia Fernanda dos Santos Ruivo', 'party': 'be', 'district': '-Braga'}, {'name': 'António José de Oliveira Cruz Mendes', 'party': 'be', 'district': '-Braga'}, {'name': 'Ana Rute Sobral Marcelino', 'party': 'be', 'district': '-Braga'}, {'name': 'Luís Miguel do Carmo Rocha Marado Moreira', 'party': 'be', 'district': '-Braga'}, {'name': 'Maria da Conceição Nogueiro Gomes', 'party': 'be', 'district': '-Bragança'}, {'name': 'Luís Miguel Vale Fernandes Vale', 'party': 'be', 'district': '-Bragança'}, {'name': 'António Manuel Couraceiro Léria', 'party': 'be', 'district': '-Bragança'}, {'name': 'Marco Paulo Dominguez Mendonça', 'party': 'be', 'district': '-Bragança'}, {'name': 'Kevin Charles Rowe', 'party': 'be', 'district': '-Bragança'}, {'name': 'João Cristiano Rodrigues Cunha', 'party': 'be', 'district': '-Bragança'}, {'name': 'Paula Cristina Barata Monteiro da Costa Nogueira', 'party': 'be', 'district': '-Bragança'}, {'name': 'José Serra dos Reis', 'party': 'be', 'district': '-Bragança'}, {'name': 'Maria Aline da Silva Gomes Camacho Baião', 'party': 'be', 'district': '-Bragança'}, {'name': 'Bruno José Patrício Pereira', 'party': 'be', 'district': '-Bragança'}, {'name': 'Fernando Farinha Ferreira', 'party': 'be', 'district': '-Bragança'}, {'name': 'Luís Neves Franco', 'party': 'be', 'district': '-Bragança'}, {'name': 'André de Matos valente', 'party': 'be', 'district': '-Bragança'}, {'name': 'Etelvina Maria Lopes Ferreira', 'party': 'be', 'district': '-Bragança'}, {'name': 'Ricardo Pereira Paulouro Neves', 'party': 'be', 'district': '-Bragança'}, {'name': 'Manuel Luís Leitão', 'party': 'be', 'district': '-Bragança'}, {'name': 'José Manuel Marques da Silva Pureza', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Ana Filomena Leite Amaral', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Luís Carlos Januário Santos', 'party': 'be', 'district': '-Coimbra'}, {'name': 'António Manuel dos Santos Rodrigues', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Délio Filipe Fernandes de Figueiredo', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Marisa Isabel dos Santos Matias', 'party': 'be', 'district': '-Coimbra'}, {'name': 'José Barreto Roque', 'party': 'be', 'district': '-Coimbra'}, {'name': 'João Paulo Águas Tomé Ferreira dos Santos', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Bruno Daniel Gomes de Sena Martins', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Ana Flor Pereira Neves', 'party': 'be', 'district': '-Coimbra'}, {'name': 'João Filipe Jordão Viegas', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Catarina Isabel Caldeira Martins', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Ana Filipa Duarte Lopes', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Artur Miguel Antunes Dias', 'party': 'be', 'district': '-Coimbra'}, {'name': 'António José André e Silva', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Abel Maria Simões Ribeiro', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Amália Maria Marques Espiridião Oliveira', 'party': 'be', 'district': '-Coimbra'}, {'name': 'João António Gomes Ferro ', 'party': 'be', 'district': '-Coimbra'}, {'name': 'José Faustino Rebocho do Monte', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Fernando Manuel da Cunha Costa', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Ana Paula Coelho Fernandes', 'party': 'be', 'district': '-Coimbra'}, {'name': 'José Manuel Baptista do Carmo', 'party': 'be', 'district': '-Coimbra'}, {'name': 'João Fernando Guerreiro Romão', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Maria Manuela Reis Raposo Fernandes', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Vidal da Conceição Marreiros', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Vitor Manuel Bexiga Ruivo', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Henrique Manuel Jerónimo Cabeleira', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Ana Isabel Fernandes Guerreiro', 'party': 'be', 'district': '-Coimbra'}, {'name': 'João Paulo Pestana Fragoso de Almeida', 'party': 'be', 'district': '-Coimbra'}, {'name': 'António Manuel Silva Pereira', 'party': 'be', 'district': '-Coimbra'}, {'name': 'João Manuel Duarte Vasconcelos', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Maria Celeste Simões Baeta', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Albano Ramos Ferreira Torres', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Bruno Filipe Bentes Cortes', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Jorge Manuel da Cunha Coutinho Noutel ', 'party': 'be', 'district': '-Coimbra'}, {'name': 'José Afonso Vieira ', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Rita Gisela Martins de Azevedo', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Mário Alexandre da Silva Loureiro ', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Paula Maria \r\n Pais Mamede Fonseca', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Tiago João Queimado \r\n e Silva', 'party': 'be', 'district': '-Coimbra'}, {'name': 'António José \r\n da Costa Almeida Matos Godinho ', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Heitor Nuno Patrício de Sousa e Castro', 'party': 'be', 'district': '-Coimbra'}, {'name': 'José Manuel Peixoto Figueira Henriques', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Maria Luís Roldão Brites Bustorff', 'party': 'be', 'district': '-Coimbra'}, {'name': 'António Manuel Brito Sequeira Mendes', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Adelino António Moreira Granja', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Maria João da Fonseca Casaleiro Franco Teixeira', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Joaquim Gil Sousa Piló', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Fernando António da Costa Rocha', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Ana Isabel Pereira da Costa Bernardes', 'party': 'be', 'district': '-Coimbra'}, {'name': 'João Maria Filipe', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Pedro Sousa Nogueira Antunes', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Celina Marques dos Santos', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Gabriel da Silva Ferreira', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Marília Inês Rodrigues Canhoto', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Paula Cristina Pereira Marques Conceição', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Francisco Anacleto Louçã', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Luís Emídio Lopes Mateus Fazenda', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Ana Isabel Drago Lobato', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Helena Maria Moura Pinto', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Diana Marina Dias Andringa', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Daniel João Figueiredo de Oliveira', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Maria Cecília Vicente Duarte Honório', 'party': 'be', 'district': '-Coimbra'}, {'name': 'António Vieira Grosso', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Paulo Aníbal de Oliveira Fidalgo', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Maria José Vitorino Gonçalves', 'party': 'be', 'district': '-Coimbra'}, {'name': 'José Manuel Marques Casimiro', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Leonor Cintra Mattos Gomes', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Miguel de Matos Castanheira do Vale de Almeida', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Ana Ribeiro Cruz', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Gil de Oliveira Garcia', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Maria Helena Augusto das Neves Gorjão', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Miguel Afonso da Silva Ribeiro Reis', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Jorge Emanuel Gomes da Silva', 'party': 'be', 'district': '-Coimbra'}, {'name': 'João Pedro Amaral Cabouco Rodrigues', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Heloísa Maria Pereira Perista', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Natasha Carmen de Santana Nunes', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Miguel da Câmara e Almeida Pinto', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Vitor Edmundo Proença da Silva', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Maria Alfreda Cordeiro da Cruz Ribeiro Viana', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Maria do Céu da Cunha Meneses Fazenda', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Fernando José de Abreu Matos', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Maria João Lopes Freitas', 'party': 'be', 'district': '-Coimbra'}, {'name': 'João Carlos Gouveia Pascoal', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Dina Maria Veredas Nunes', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Maria Manuela Monteiro da Silva Fonseca', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Maria Teresa Alves Sousa de Almeida', 'party': 'be', 'district': '-Coimbra'}, {'name': 'André Aurélio Marona Beja', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Ana Rita Teles Patrocínio Silva', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Luís Carlos Betencourt de Matos Leiria', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Carolina Maria Portela Cardoso', 'party': 'be', 'district': '-Coimbra'}, {'name': 'António Manuel Candeias Coelho dos Santos', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Vitor Manuel Rodrigues Brilhante', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Rita Susana Borges Cortez Folgosa', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Sérgio Magos Jorge de Sousa Vitorino', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Raquel Cardeira Varela', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Gonçalo Magos Jorge de Sousa Vilarinho', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Francisco José de Jesus Oliveira Raposo', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Isabel Maria de Sousa Lopes de Faria', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Helder Manuel Monteiro', 'party': 'be', 'district': '-Coimbra'}, {'name': "Rita d'Ávila Cachado", 'party': 'be', 'district': '-Coimbra'}, {'name': 'Tiago Gillot Faria', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Rita Maria Oliveira Calvário', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Isabel Maria Sousa Pinto Allegro de Magalhães', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Mara Madalena Lopes Correia', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Mário José da Silva Fonseca', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Berta Maria Bessone Ferreira Alves', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Ana Paula Ribeiro Aboim Gomes', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Maria do Céu Lopes Maia Cadete', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Roberto Carlos \r\n Teixeira Almada', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Rodrigo Nuno \r\n Pontes de Gouveia Trancoso', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Joana Maria \r\n Vieira Martins', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Ana Paula Rodrigues', 'party': 'be', 'district': '-Coimbra'}, {'name': 'José António \r\n Abreu Santos', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Cláudia Vanessa \r\n Fernandes Gonçalves', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Ana Maria Gouveia \r\n Gonçalves', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Eduino Narciso \r\n de Araújo Aguiar', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Mário Camacho \r\n de Sousa', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Carla Susana \r\n Silva e Freitas Cardoso', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Fernando Dinarte \r\n Almada de Gouveia', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Bruno Sousa \r\n Jardim ', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Paulo José da \r\n Rosa Cardoso', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Joana Rosa Palmeiro \r\n de Deus', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Maria Germana Frazão da Silveira de Carvalho', 'party': 'be', 'district': '-Coimbra'}, {'name': 'José Luís Peixoto', 'party': 'be', 'district': '-Coimbra'}, {'name': 'João Miguel Trancoso Vaz Teixeira Lopes', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Alda Maria Gonçalves Pereira Macedo', 'party': 'be', 'district': '-Coimbra'}, {'name': 'João Pedro Furtado da Cunha Semedo', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Alda Maria Botelho Correia de Sousa', 'party': 'be', 'district': '-Coimbra'}, {'name': 'José Borges de Araújo de Moura Soeiro', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Maria de Fátima Félix Pereira Grácio', 'party': 'be', 'district': '-Coimbra'}, {'name': 'José Manuel Machado de Castro', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Maria da Conceição de Oliveira Carvalho Nogueira', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Gonçalo Manuel Lemos dos Reis Torgal', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Jorge Duarte Chaves Magalhães ', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Ana Luísa Ribeiro Barata do Amaral', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Maria José de Sousa Magalhães', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Alberto de Sousa e Silva', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Maria Cecília Peixoto da Eira', 'party': 'be', 'district': '-Coimbra'}, {'name': 'João Paulo Rebelo da Silva', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Fernando José Leite de Oliveira Queiroz', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Hugo Manuel Mota Cardoso da Silva', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Tiago Barbosa Ribeiro', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Armando Herculano Lopes Ferreira', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Maria Esmeralda Correia Mateus', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Eduardo Augusto Ramos Valdrez', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Joaquim Manuel Monteiro Espirito Santo', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Catarina Príncipe Leal Azevedo Fernandes', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Paulo Fernando Teles de Lemos e Silva', 'party': 'be', 'district': '-Coimbra'}, {'name': 'José Alfredo Carneiro Teixeira Viana', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Joaquim dos Santos Pinho', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Ana Paula Santos Pereira Sequeiros', 'party': 'be', 'district': '-Coimbra'}, {'name': 'António Alcino Norte Simões ', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Bruno da Cruz Maia', 'party': 'be', 'district': '-Coimbra'}, {'name': 'António Teixeira Gomes', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Pedro Jorge Teixeira Ferreira', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Maria Elisa de Carvalho Antunes Magalhães', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Tiago Filipe Pereira Brandão de Pinho', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Francisco Amorim Santos Baptista', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Isabel Maria de Sousa Hortas', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Paulo Alberto Branco Teixeira de Sousa', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Maria Alice Moreira Ribeiro dos Santos', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Alexandre Vieira Pinto Alves Costa', 'party': 'be', 'district': '-Coimbra'}, {'name': 'António Martins Moreira Capelo', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Orlando Deolindo Gonçalves Carvalho', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Luís Eugénio de Oliveira Peres', 'party': 'be', 'district': '-Coimbra'}, {'name': 'João Joaquim Monteiro Damas', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Paulo Renato Cardoso Ricardo', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Joana Beatriz Nunes Vicente Amaral Dias', 'party': 'be', 'district': '-Coimbra'}, {'name': 'António Francisco Gomes Lopes', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Pedro Choy de Amélia Cordeiro', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Maria de Fátima Vieira Figueira Roldão', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Fabíola Cruz Neto Cardoso', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Natércia Rodrigues Lopes', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Carlos Alberto Trincão e Conceição', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Guilherme Sarmento Pinto', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Carla Maria Pires Rodrigues', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Ana Patrícia de Campos Bica', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Manuel António Rodrigues Lopes', 'party': 'be', 'district': '-Coimbra'}, {'name': 'José das Neves Filipe', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Rui Miguel Gonçalves Fernandes', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Carlos Miguel dos Santos Faria', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Luís Filipe Lopes de Freitas', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Fernando José Mendes Rosas', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Mariana Rosa Aiveca Ferreira', 'party': 'be', 'district': '-Coimbra'}, {'name': 'António Augusto Jordão Chora', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Mónica Orlanda Jeanne Frechaut', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Maria Manuela Paiva Fernandes Tavares', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Mário Durval Póvoa do Rosário', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Luís Artur Ribeiro Gomes', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Almerinda Lopes Bento', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Maria Alice Silva de Brito', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Jaime Manuel Almeida Pinho', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Cristina Maria de Melo Cavalinhos', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Daniel Patt Arruda', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Joaquim Inácio Raminhos Cabaça', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Cipriano José dos Santos Pisco', 'party': 'be', 'district': '-Coimbra'}, {'name': 'João Manuel Martins Madeira', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Henrique João da Costa Guerreiro', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Ana Luisa Brito Costa Alho', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Igor Alexandre Claro Caldeira', 'party': 'be', 'district': '-Coimbra'}, {'name': 'António José de Azevedo Albergaria Samara', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Humberto Manuel Coelho Candeias', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Cristina Luisa Nunes Sizifredo', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Maria Filomena Castro Coelho de Oliveira e Sousa', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Luís Filipe de Oliveira Louro', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Fernando António da Silva Marques', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Maria José Braga Cerqueira', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Francisco Ribeiro Vaz', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Paula Alexandra Caravela Barbosa Braga', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Sebastião José da Cunha Torres Correia', 'party': 'be', 'district': '-Coimbra'}, {'name': 'António Manuel Antas Moreira', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Jorge Manuel Lopes Rodrigues Lima', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Manuel de Sá da Mota', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Rui Rodrigues Marques', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Suplente 5', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Paulo Henrique das Neves Martins Pires', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Miguel Marinho Ferreira Queimado', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Carlos Manuel Moreira Gomes', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Rui Manuel Victor Cortes', 'party': 'be', 'district': '-Coimbra'}, {'name': 'José Henrique Morgado de Sousa Martins', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Raul Rocha Magalhães Castro Marques', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Ana Sofia Matos Gomes', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Maria da Graça Melo Cabral Marques Pinto', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Carlos Alberto Vieira e Castro Rodrigues', 'party': 'be', 'district': '-Coimbra'}, {'name': 'José Carlos Costa Vasconcelos', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Joaquim José Tato Fidalgo Freitas', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Patrícia Marques Cardoso', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Carla Maria de Albuquerque Mendes', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Abílio Gomes Travessas', 'party': 'be', 'district': '-Coimbra'}, {'name': 'António João Loureiro Amaro', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Clara Maria Mendes Pais Alexandre', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Manuela Maria Coelho Antunes', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Bárbara Soares de Oliveira e Sá', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Carlos Alberto do Couto Esteves de Almeida', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Pedro Miguel Marques Cerdeira', 'party': 'be', 'district': '-Coimbra'}, {'name': 'Sandra Cristina Miranda Costa Bastos', 'party': 'be', 'district': '-Coimbra'}]
迭代各方的解决方案:
list2 = ['be', 'cdu', 'cds', 'ph', 'pnd', 'pnr', 'pctp', 'pous', 'pda', 'psd', 'ps']
result = [[{'name':i, 'party':'be', 'district':k['name']} for k in get_page(party) for i in k['vals']] for party in list2]
关于python - 我如何抓取该网站以便按列表对候选人进行分类?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58274397/
如本answer所述,如果浏览器不支持 e,可以设置后备游标。 G。 光标:抓取;。我现在的问题是获取这些图像。在我的驱动器上本地搜索“.cur”只给了我系统光标,其中 grab.cur 和 grab
以下代码在计算机上运行以从 Instagram 帐户中抓取数据。当我尝试在 VPS 服务器上使用它时,我被重定向到 Instagram 登录页面,因此脚本不起作用。 为什么当我在电脑上或服务器上时,I
我在使用 Ruby 和 Mechanize 将 POST 查询传递到站点的网站上。访问站点的查询基于 firebug,如下所示 param.PrdNo=-1¶m.Type=Prop¶m
我正在尝试抓取一个具有多个页面结果的网站,例如“1、2、3、4、5...”。 每个分页号都是到另一个页面的链接,我需要抓取每个页面。 到目前为止,我想出了这个: while lien = page.l
我正在使用 HtmlAgilityPack 在 C# Asp.Net 中执行 Scraping,到目前为止,我在从多个 Web 执行 Scratch 时没有遇到问题,但是,尝试弹出以下代码时出现错误
如果我有一个 css 文件做这样的事情 #foo:after{content:"bar;} ,有没有办法用 javascript 获取 :after 的内容?获取父元素的内容只返回 #foo 元素的内
问题是这样的: 我有一个 Web 应用程序 - 一个经常更改的通知系统 - 在一系列本地计算机上运行。该应用程序每隔几秒刷新一次以显示新信息。计算机仅显示信息,没有键盘或任何输入设备。 问题是,如果与
我想制作一个程序来模拟用户浏览网站和点击链接。必须启用 Cookie 和 javascript。我已经在 python 中成功地做到了这一点,但我想把它写成一种可编译的语言(python ide 不会
我制作了这个小机器人,它通过搜索参数列表进行处理。它工作正常,直到页面上有几个结果: product_prices_euros 给出了一半为空的项目列表。因此,当我与 product_prices_c
我需要找到一个单词的匹配项,例如: 在网上找到所有单词“学习”https://www.georgetown.edu/(结果:4个字)(您可以看到它按CTRL + F并搜索) 我有我的 Python 代
有一个站点\资源提供一些一般统计信息以及搜索工具的界面。这种搜索操作成本高昂,因此我想限制频繁且连续(即自动)的搜索请求(来自人,而不是来自搜索引擎)。 我相信有很多现有的技术和框架可以执行一些情报抓
这并不是真正的抓取,我只是想在网页中找到类具有特定值的 URL。例如: 我想获取 href 值。关于如何做到这一点的任何想法?也许正则表达式?你能发布一些示例代码吗?我猜 html 抓取库,比如 B
我正在使用 scrapy。 我正在使用的网站具有无限滚动功能。 该网站有很多帖子,但我只抓取了 13 个。 如何抓取剩余的帖子? 这是我的代码: class exampleSpider(scrapy.
我正在尝试从这个 website 中抓取图像和新闻 url .我定义的标签是 root_tag=["div", {"class":"ngp_col ngp_col-bottom-gutter-2 ng
关闭。这个问题需要更多focused .它目前不接受答案。 想改进这个问题吗? 更新问题,使其只关注一个问题 editing this post . 关闭上个月。 Improve this ques
我在几个文件夹中有数千个 html 文件,我想从评论中提取数据并将其放入 csv 文件中。这将允许我为项目格式化和清理它。例如,我在这个文件夹中有 640 个 html 文件: D:\My Web S
我在编写用于抓取网页的实用程序时遇到了一个问题。 我正在发送 POST 请求来检索数据,我模仿我正在抓取的网络行为(根据使用 fiddler 收集的信息)。 我已经能够自动替换我的 POST 中除 V
对于 Googlebot 的 AJAX 抓取,我在我的网站中使用“_escaped_fragment_”参数。 现在我查看了 Yandex 对我网站的搜索结果。 我看到搜索结果中不存在 AJAX 响应
我正在尝试抓取网站的所有结果页面,它可以工作,但有时脚本会停止并显示此错误: 502 => Net::HTTPBadGateway for https://website.com/id/12/ --
我是一个学习网络爬虫的初学者,由于某种原因我无法爬网this地点。当我在 Chrome 中检查它时,代码看起来不错,但是当我用 BeautifulSoup 阅读它时,它不再是可刮的。汤提到“谷歌分析”
我是一名优秀的程序员,十分优秀!