gpt4 book ai didi

python - 如何使用 python 抓取下拉列表

转载 作者:太空宇宙 更新时间:2023-11-03 20:09:20 25 4
gpt4 key购买 nike

我必须从此网页抓取数据:http://www.mlsa.am/?page_id=368 。这是一个下拉列表,其中选项包括:Regions、Areas、Communities、Type of Subsidy、Month 和 Year。一旦选择了这些选项,就会出现一个表格,其中包含这些地方获得不同类型补贴的公民的信息。我当时面临的困难是“区域”字段取决于我选择的“区域”,而“社区”则取决于它们两者。这就是我检查网页时的样子,这些信息属于“区域”(第一个选项)单元格:


`<!--Մարզեր-->
<div class="td-pb-row">
<div class="td-pb-span2"></div>
<div class="td-pb-span5">
Մարզեր <span class="ben-required">*</span> &nbsp;&nbsp;&nbsp;
<select id="ref_regions_id" name="ref_regions" style="border:1px solid #0790A2;" >
<option value="0" > Ընտրել </option>
<option value="1"> ԱՐԱԳԱԾՈՏՆ</option>`

<option value="2"> ԱՐԱՐԱՏ</option>

<option value="3"> ԱՐՄԱՎԻՐ</option>

<option value="4"> ԳԵՂԱՐՔՈՒՆԻՔ</option>

<option value="5"> ԼՈՌԻ</option>

<option value="6"> ԿՈՏԱՅՔ</option>

<option value="7"> ՇԻՐԱԿ</option>

<option value="8"> ՍՅՈՒՆԻՔ</option>

<option value="9"> ՎԱՅՈՑ ՁՈՐ</option>

<option value="10"> ՏԱՎՈՒՇ</option>

<option value="11"> ԵՐԵՎԱՆ</option>`

</select>
</div>

我正在将 selenium 与 python 一起使用,到目前为止这是我的代码:

`import time
import requests
from selenium import webdriver
from selenium.common.exceptions import WebDriverException
from selenium.common.exceptions import TimeoutException
from selenium.webdriver.common.keys import Keys
chrome_path = r"C:\Users\ivrav\selenium-2.25.0\Driver\chromedriver.exe"
driver = webdriver.Chrome(chrome_path)
print("loading url into browser...")
def get_all_pages():
payload={'value':'1'}
driver.get("http://www.mlsa.am/?page_id=368")
print(url.text)
time.sleep(2)`

最佳答案

抱歉,我看不懂该网页

您应该创建一个 selenium 操作链来选择您需要的每个选项,然后单击按钮。

这是reference

关于python - 如何使用 python 抓取下拉列表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58789661/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com