- android - RelativeLayout 背景可绘制重叠内容
- android - 如何链接 cpufeatures lib 以获取 native android 库?
- java - OnItemClickListener 不起作用,但 OnLongItemClickListener 在自定义 ListView 中起作用
- java - Android 文件转字符串
我正在尝试仅从已选中的表单中检索复选框旁边的标签文本。
这是 html:
<div class="x-panel-bwrap" id="ext-gen1956"><div
class="x-panel-body" id="ext-gen1957" style="width: 226px;">
<div class="x-form-check-wrap" id="ext-gen1959"><input type="checkbox" autocomplete="off" id="ext-comp-1609" name="ext-comp-1609" class=" x-form-checkbox x-form-field">
<label for="ext-comp-1609" class="x-form-cb-label" id="ext-gen1960">labeltext1</label></div>
<div class="x-form-check-wrap" id="ext-gen1961"><input type="checkbox" autocomplete="off" id="ext-comp-1607" name="ext-comp-1607" class=" x-form-checkbox x-form-field">
<label for="ext-comp-1607" class="x-form-cb-label" id="ext-gen1962">labeltext2</label></div>
<div class="x-form-check-wrap" id="ext-gen1963"><input type="checkbox" autocomplete="off" id="ext-comp-1605" name="ext-comp-1605" class=" x-form-checkbox x-form-field" checked="">
<label for="ext-comp-1605" class="x-form-cb-label" id="ext-gen1964">labeltext3</label></div>
我想要获取的复选框旁边的标签由属性 checked=""区分
for checkboxes in soup.find_all('input', attrs={"id":"ext-comp-1609"}):
if checkboxes.find('input', attrs={"checked":""}):
label_1 = soup.find('label',{'id':'ext-gen1960'}).text
print(label_1)
else:
continue
for checkboxes in soup.find_all('input', attrs={"id":"ext-comp-1607"}):
if checkboxes.find('input', attrs={"checked":""}):
label_2 = soup.find('label',{'id':'ext-gen1962'}).text
print(label_2)
except:
continue
for checkboxes in soup.find_all('input', attrs={"id":"ext-comp-1605"}):
if checkboxes.find('input', attrs={"checked":""}):
label_3 = soup.find('label',{'id':'ext-gen1964'}).text
print(label_3)
else:
continue
我的问题是,无论标签是否被选中,它都会抓取标签。我也尝试过使用 has_attr() 但它产生了相同的结果。
尝试过的解决方案:
soup = BeautifulSoup(browser.page_source, 'html.parser')
for checkbox in soup.find_all('input', checked=True):
print(checkbox.label.get_text())
和
soup = BeautifulSoup(browser.page_source, 'html.parser')
for checkbox in soup.select('input[checked]'):
print(checkbox.label.get_text())
for checkbox in soup.find_all('input', checked=True):
print(checkbox.find_next_sibling("label").get_text())
最佳答案
您应该对所有 input
元素应用 checked=True
检查。然后,获取内部 label
元素及其文本:
soup = BeautifulSoup(data, "html.parser")
for checkbox in soup.find_all('input', checked=True):
print(checkbox.label.get_text())
请注意,对于 html5lib
或 lxml
,您需要一种不同的方式来获取标签:
soup = BeautifulSoup(data, "html5lib")
for checkbox in soup.find_all('input', checked=True):
print(checkbox.find_next_sibling("label").get_text())
在你的输入数据上为我工作:
In [1]: from bs4 import BeautifulSoup
In [2]: data = """your HTML here"""
In [3]: soup = BeautifulSoup(data, "html.parser")
In [4]: for checkbox in soup.find_all('input', checked=True):
...: print(checkbox.label.get_text())
...:
Can Submit Expense Reports
关于python - 使用 BeautifulSoup 检查是否存在没有值的属性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42535305/
你能比较一下属性吗 我想禁用文本框“txtName”。有两种方式 使用javascript,txtName.disabled = true 使用 ASP.NET, 哪种方法更好,为什么? 最佳答案 我
Count 属性 返回一个集合或 Dictionary 对象包含的项目数。只读。 object.Count object 可以是“应用于”列表中列出的任何集合或对
CompareMode 属性 设置并返回在 Dictionary 对象中比较字符串关键字的比较模式。 object.CompareMode[ = compare] 参数
Column 属性 只读属性,返回 TextStream 文件中当前字符位置的列号。 object.Column object 通常是 TextStream 对象的名称。
AvailableSpace 属性 返回指定的驱动器或网络共享对于用户的可用空间大小。 object.AvailableSpace object 应为 Drive 
Attributes 属性 设置或返回文件或文件夹的属性。可读写或只读(与属性有关)。 object.Attributes [= newattributes] 参数 object
AtEndOfStream 属性 如果文件指针位于 TextStream 文件末,则返回 True;否则如果不为只读则返回 False。 object.A
AtEndOfLine 属性 TextStream 文件中,如果文件指针指向行末标记,就返回 True;否则如果不是只读则返回 False。 object.AtEn
RootFolder 属性 返回一个 Folder 对象,表示指定驱动器的根文件夹。只读。 object.RootFolder object 应为 Dr
Path 属性 返回指定文件、文件夹或驱动器的路径。 object.Path object 应为 File、Folder 或 Drive 对象的名称。 说明 对于驱动器,路径不包含根目录。
ParentFolder 属性 返回指定文件或文件夹的父文件夹。只读。 object.ParentFolder object 应为 File 或 Folder 对象的名称。 说明 以下代码
Name 属性 设置或返回指定的文件或文件夹的名称。可读写。 object.Name [= newname] 参数 object 必选项。应为 File 或&
Line 属性 只读属性,返回 TextStream 文件中的当前行号。 object.Line object 通常是 TextStream 对象的名称。 说明 文件刚
Key 属性 在 Dictionary 对象中设置 key。 object.Key(key) = newkey 参数 object 必选项。通常是 Dictionary 
Item 属性 设置或返回 Dictionary 对象中指定的 key 对应的 item,或返回集合中基于指定的 key 的&
IsRootFolder 属性 如果指定的文件夹是根文件夹,返回 True;否则返回 False。 object.IsRootFolder object 应为&n
IsReady 属性 如果指定的驱动器就绪,返回 True;否则返回 False。 object.IsReady object 应为 Drive&nbs
FreeSpace 属性 返回指定的驱动器或网络共享对于用户的可用空间大小。只读。 object.FreeSpace object 应为 Drive 对象的名称。
FileSystem 属性 返回指定的驱动器使用的文件系统的类型。 object.FileSystem object 应为 Drive 对象的名称。 说明 可
Files 属性 返回由指定文件夹中所有 File 对象(包括隐藏文件和系统文件)组成的 Files 集合。 object.Files object&n
我是一名优秀的程序员,十分优秀!