- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我对Python和所有东西都非常陌生,我正在尝试让BeautifulSoup从本页的这个表的一个特定单元格返回一个数字值(或同一维基中的任何其他类似页面)
现在我所拥有的是:
url = ('http://unisonleague.wikia.com/wiki/Brynhildr,_Dual_Lancer_(Gear)')
r = requests.get(url)
data = r.text
soup = BeautifulSoup (data , 'html.parser')
table = soup.find (id='mw-content-text')
rows = table.find ('tr')
cells = rows.findAll('td')
我想要的值来自“Max Unison Chance”旁边的单元格,因此在本例中为“10004”。
<td colspan="2" style="background-color:#5B4F3D; color:#ffffff;"> 10004 </td>
我试过了
soup.findAll('td colspan="2"')
和
soup.find('td colspan')
但它只是返回任何内容或一个空列表。
我不太确定从这里到哪里去,我考虑/尝试过按行数索引(我相信这是行 [14]),也许是单元格,但我似乎无法正确获取代码?
最佳答案
不要像您那样采用自上而下的方法,而是使用 html 的树结构来发挥您的优势。我假设您想将其推广到其他类似格式的页面,所以您可以做的就是将其中带有“Max Unison Chance”的单元格视为 anchor ,然后您将遍历 Beautiful Soup 创建的解析树以到达您正在寻找的单元格。这是包含描述单元格和您要查找的单元格的 html/
<td style="height: 29px; background-color:#3F2D18; color:#ffffff; font-size:7pt;"> <b><span style="cursor:help;" title="Maximum stats used during a Unison Chance. It is the total of both stats with +198.">Max Unison Chance</span>:</b>
</td><td colspan="2" style="background-color:#5B4F3D; color:#ffffff;"> 10004
</td>
这里可以通过调用直接获取包含“Max Unison Chance”的html标签:
element = soup.find(text='Max Unison Chance')
这将为您提供包含文本“Max Unison Chance”的元素。然后,如果您查看包含您正在查找的数字的标签相对于您现在拥有的元素的位置。您可以看到,您需要向上三个节点才能到达包含 10004 的单元格旁边的元素。
要导航到此单元格,我们可以使用元素的父属性并使用属性链:
great_grandparent = element.parent.parent.parent
我们现在需要通过以下方式获取我们曾祖 parent 的下一个 sibling :
target_cell = great_grandparent.next_sibling
最后获取元素的文本值并清理它:
result = target_cell.text.strip()
然后将它们放在一起:
from bs4 import BeautifulSoup
import requests
url = ('http://unisonleague.wikia.com/wiki/Brynhildr,_Dual_Lancer_(Gear)')
r = requests.get(url)
data = r.text
soup = BeautifulSoup (data , 'html.parser')
element= soup.find(text='Max Unison Chance')
result = element.parent.parent.parent.next_sibling.text.strip()
另一种方法是使用解析顺序而不是树顺序,这样您就可以将结果替换为:
result = cell.next.next.next.strip()
由于下一个属性根据您使用的解析器的工作方式引用下一个元素
关于python - 使用 BeautifulSoup 从表中的单元格中提取值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47709024/
我已经尝试在我的 CSS 中添加一个元素来删除每三个 div 的 margin-right。不过,似乎只是出于某种原因影响了第 3 次和第 7 次。需要它在第 3、6、9 等日工作... CSS .s
如何使 div/input 闪烁或“脉冲”?例如,假设表单字段输入了无效值? 最佳答案 使用 CSS3 类似 on this page ,您可以将脉冲效果添加到名为 error 的类中: @-webk
我目前正在尝试构建一个简单的 wireframe来自 lattice 的情节包,但由沿 y 轴的数百个点组成。这导致绘图被线框网格淹没,您看到的只是一个黑色块。我知道我可以用 col=FALSE 完全
在知道 parent>div CSS 选择器在 IE 中无法识别后,我重新编码我的 CSS 样式,例如: div#bodyMain div#paneLeft>div{/*styles here*/}
我有两个 div,一个在另一个里面。当我将鼠标悬停 到最外面的那个时,我想改变它的颜色,没问题。但是,当我将鼠标悬停 到内部时,我只想更改它的颜色。这可能吗?换句话说,当 将鼠标悬停到内部 div 上
我需要展示这样的东西 有人可以帮忙吗?我可以实现以下输出 我正在使用以下代码:: GridView.builder( scrollDirection: Axis.vertical,
当 Bottom Sheet 像 Android 键盘一样打开时,是否有任何方法可以手动上推布局( ScrollView 或回收器 View 或整个 Activity )?或者你可以说我想以 Bott
我有以下代码,用于使用纯 HTML 和 CSS 显示翻转。当您将鼠标悬停在文本上时,它会更改左右图像。 在我测试的所有浏览器中都运行良好,Safari 4 除外。据我收集的信息,Safari 4 支持
我构建了某种 CMS,但在使用 TinyMCE 和 Bootstrap 时遇到了一些问题。 我有一个页面,其中概述了一个 div,如果用户单击该 div,他们可以从模态中选择图像。该图像被插入到一个
出于某种原因,当我设置一个过渡时,当我的鼠标悬停在一个元素上时,背景会改变颜色,它只适用于一个元素,但它们都共享同一个类?任何帮助我的 CSS .outer_ad { position:rel
好吧,这真的很愚蠢。我不知道 Android Studio 中的调试监视框架发生了什么。我有 1.5.1 的工作室。 是否有一些来自 intellij 的 secret 知识来展示它。 最佳答案 与以
我有这个标记: some code > 我正在尝试获取此布局: 注意:上一个和下一个按钮靠近#player 我正在尝试这样: .nextBtn{
网站:http://avuedesigns.com/index 首页有 6 个菜单项。我希望每件元素在您经过时都有自己的颜色。 这是当您将鼠标悬停在 div 上时将所有内容更改为白色的行 li#hom
我需要在 index.php 文件中显示它,但没有任何效果。我所有的文章都没有正确定位。我将其用作代码: 最佳答案 您可以首先检查您
我是一名优秀的程序员,十分优秀!