作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
此 Wikipedia page包含两个引用错误。您可以在页面底部上方的红色句子(引用序列号 6 和 95)中找到引用错误。当我检查元素时,我发现我应该提取特定的跨度类,即 <span class="error mw-ext-cite-error"
我如何获得<span class="error mw-ext-cite-error
的外部html 的副本“数据?
以下代码给出了所有 <span class>
数据。
from bs4 import BeautifulSoup
import requests
import csv
getUrl= 'https://ta.wikipedia.org/s/h6h'
url = getUrl
content = requests.get(url).content
soup = BeautifulSoup(content,'lxml')
heading = soup.title
print(heading.text)
#to get the specific li-interwiki-ta tag<span class="error mw-ext-cite-error"
refError = soup.findAll ('span')
print (refError)
<span class="error mw-ext-cite-error
数据?
最佳答案
您可以通过以下方式过滤特定类并迭代元素:
refError = soup.findAll('span', { 'class': 'mw-ext-cite-error'})
for error in refError:
print error
关于python-3.x - 如何通过维基百科页面的 BS4 过滤特定的跨度类?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42603857/
我在 StackOverflow 和其他地方看到了很多与此类似的问题,但没有一个直接解决我的问题。我正在 THREE.js 中使用凸包生成器生成 n 边多面体。我想将方形纹理映射到每个多面体的每个面上
我是一名优秀的程序员,十分优秀!