gpt4 book ai didi

python - 试图查找某些文本是否存在

转载 作者:太空宇宙 更新时间:2023-11-04 09:27:39 24 4
gpt4 key购买 nike

我正在尝试查看我正在抓取的网站的个人资料页面上是否存在文本“国家注册”。它就在文本“许可工作于:”之后...如果它包含文本,我会将他们的许可类型写入 csv 文件,作为“国家注册”,如果该文本不存在,我将为csv 文件中的许可证...这就是我使用的问题/编码逻辑

这是我正在测试我的代码的个人资料页面的链接 https://www.zillow.com/lender-profile/zackdisinger/

它一直打印错误...下面是我正在尝试的代码

from selenium import webdriver
from bs4 import BeautifulSoup
import time

#Chrome webdriver filepath...Chromedriver version 74
driver = webdriver.Chrome(r'C:\Users\mfoytlin\Desktop\chromedriver.exe')
page = driver.get('https://www.zillow.com/lender-profile/zackdisinger/')
time.sleep(2)
show_more_button = driver.find_element_by_class_name('zsg-wrapper-footer').click()
time.sleep(2)
soup = BeautifulSoup(driver.page_source, 'html.parser')


if soup.find(text='Nationally registered'):
print('Success')
else:
print('False')

最佳答案

在 bs4 4.7.1 中,您可以使用 :contains 检查包含该字符串的 p 标签。我给了 True/False 虽然很容易适应 Success/False

from selenium import webdriver
from bs4 import BeautifulSoup
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

#Chrome webdriver filepath...Chromedriver version 74
driver = webdriver.Chrome(r'C:\Users\mfoytlin\Desktop\chromedriver.exe')
page = driver.get('https://www.zillow.com/lender-profile/zackdisinger/')
WebDriverWait(driver, 10).until(EC.element_to_be_clickable((By.CSS_SELECTOR, ".zsg-wrapper-footer a"))).click()
soup = BeautifulSoup(driver.page_source, 'html.parser')
data = soup.select_one('p:contains("Nationally registered")')
print(data is not None)

关于python - 试图查找某些文本是否存在,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56938345/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com