gpt4 book ai didi

python - 当第一个链接旁边包含特定关键字时无法获取第二个链接

转载 作者:太空宇宙 更新时间:2023-11-04 09:33:08 25 4
gpt4 key购买 nike

我已经在 python 中创建了一个与 selenium 关联的脚本,以获取任何搜索项的第一个链接(由 duckduckgo.com 填充),除非关键字 Ad 是就在该链接旁边,如下图所示。如果第一个链接包含 very 关键字,那么脚本将获取第二个链接并退出。

我当前的搜索是 houzz

enter image description here

这是我的尝试(无论该关键字 Ad 是否存在,它总是获得第一个链接):

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

link = "https://duckduckgo.com/?q={}&ia=web"

def get_info(driver,keyword):
driver.get(link.format(keyword))
for item in wait.until(EC.presence_of_all_elements_located((By.CSS_SELECTOR,"h2.result__title"))):
lead_link = item.find_element_by_css_selector("a.result__a").get_attribute("href")
break
print(lead_link)

if __name__ == '__main__':
chromeOptions = webdriver.ChromeOptions()
chromeOptions.add_argument("--headless")
driver = webdriver.Chrome(options=chromeOptions)
wait = WebDriverWait(driver, 10)
try:
get_info(driver,"*houzz*")
finally:
driver.quit()

如果 Ad 关键字与第一个链接相邻,我如何纠正我的脚本以获取第二个链接?

最佳答案

看起来只需添加#links:

lead_link = item.find_element_by_css_selector("#links a.result__a").get_attribute("href")

广告位于 #ads div 中

关于python - 当第一个链接旁边包含特定关键字时无法获取第二个链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54874101/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com