- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在尝试从以下 html 结构中提取文本:
<div class="account-age">
<label></label>
<div>
<div>
<span>Text to extract</span>
</div>
</div>
</div>
我有以下 Beautiful Soup 代码可以做到这一点:
from bs4 import BeautifulSoup as bs
soup = bs(html, "lxml")
div = soup.find("div", {"class": "account-age"})
span = div.children[1].children[0].children[0]
text = span.get_text()
不幸的是,Beautiful Soup 抛出错误:“list_iterator”对象不可订阅。我该如何解决这个问题以提取我需要的文本?
最佳答案
您可以通过直接从根 div
链接标签来做到这一点:
div.div.div.span.get_text()
# u'Text to extract'
关于Python BeautifulSoup : 'list_iterator' object is not subscriptable,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50703496/
我想看看类的定义list_iterator .当我尝试使用函数 help 显示其定义时我得到一个错误。有没有我必须导入的模块才能获得它的帮助? 更准确地说,我想知道如何获取对迭代器迭代的对象的引用。例
假设我有 li = iter([1,2,3,4])。 当我执行 next(li) 时,垃圾收集器是否会删除对不可访问元素的引用。 关于 deque,di = iter(deque([1,2,3,4])
这个问题在这里已经有了答案: Why can't I iterate twice over the same iterator? How can I "reset" the iterator or
我正在尝试从以下 html 结构中提取文本: Text to extract 我有以下 Beautifu
我正在尝试在 pandas DataFrame 内使用斯坦福依赖解析器。 from nltk.parse import stanford import pandas as pd dep_parser=
我是一名优秀的程序员,十分优秀!