- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试使用隐藏在 DOM 中的元素,并使用 Selenium WebDriver 和 beautifulsoup 来处理它们。我尝试仅使用简单的 sleep 计时器和预期条件:
WebDriverWait(chrome, 10).until(expected_conditions.presence_of_element_located((By.CLASS_NAME, "mgm")))
但是这些选项都不起作用。
此堆栈是否允许从隐藏元素加载值,如下面的代码所示?
String url = "https://www.facebook.com/cedarstreettimes?fref=ts";
String ua = "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_8_2) AppleWebKit/537.33 (KHTML, like Gecko) Chrome/27.0.1438.7 Safari/537.33";
Document doc = Jsoup.connect(url).userAgent(ua).timeout(10*1000).get();
// move the hidden commented out html into the DOM proper:
Elements hiddenElements = doc.select("code.hidden_elem");
for (Element hidden: hiddenElements) {
for (Node child: hidden.childNodesCopy()) {
if (child instanceof Comment) {
hidden.append(((Comment) child).getData()); // comment data parsed as html
}
}
}
Elements articles = doc.select("div[role=article]");
for (Element article: articles) {
if (article.select("span.userContent").size() > 0) {
String text = article.select("span.userContent").text();
String imgUrl = article.select("div.photo img").attr("abs:src");
System.out.println(String.format("%s\n%s\n\n", text,imgUrl));
}
}
最佳答案
从 BeautifulSoup
的 Angular 来看,不存在“隐藏”元素 - 它不是浏览器,如果文档中存在某个元素,您就可以找到它。
selenium
还会定位隐藏元素,并且 presence_of_element_ located
预期条件应适合此处。您将无法与隐藏元素交互,但能够提取其中的信息。
关于javascript - 带有 python 和 beatifulsoup4 的 selelenium 是否允许像 jsoup 中那样显式地从 DOM 加载隐藏元素?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35849613/
我在使用 python 和 BeautifulSoup 制作的爬虫中无法让 decompose() 函数正常工作。 问题如下。我正在尝试从网站产品中获取所有规范数据(您可以在源代码中看到): soup
我正在学习 Python,我正在尝试使用 BeautifulSoup 解析用 PHP 制作的网页。我的问题是我的脚本显示此错误: A PHP Error was encountered Severi
使用 python 库、request 和 BeautifulSoup,我正在尝试抓取此维基百科页面上的表格:https://en.wikipedia.org/wiki/Mobile_country_
names = soup.find_all('meta', itemprop='name') prices = soup.find_all('span', class_='price product-
似乎当有一个没有将自身标记为自关闭的输入标签时(我认为这在 HTML 4 中是有效的), BeautifulSoup 4 无法正确识别它 例如: >>> s=BeautifulSoup("") >>>
我是一名优秀的程序员,十分优秀!