- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在使用以下 HTML“ block ”:
<div class="marketing-directories-results">
<ul>
<li>
<div class="contact-details">
<h2>
A I I Insurance Brokerage of Massachusetts Inc
</h2>
<br/>
<address>
183 Davis St
<br/>
East Douglas
<br/>
Massachusetts
<br/>
U S A
<br/>
MA 01516-113
</address>
<p>
<a href="http://www.agencyint.com">
www.agencyint.com
</a>
</p>
</div>
<span data-toggle=".info-cov-0">
Additional trading information
<i class="icon plus">
</i>
</span>
<ul class="result-info info-cov-0 cc">
<li>
<strong>
Accepts Business From:
</strong>
<ul class="cc">
<li>
U.S.A
</li>
</ul>
</li>
<li>
<strong>
Classes of business
</strong>
<ul class="cc">
<li>
Engineering
</li>
<li>
NM General Liability (US direct)
</li>
<li>
Property D&F (US binder)
</li>
<li>
Terrorism
</li>
</ul>
</li>
<li>
<strong>
Disclaimer:
</strong>
<p>
Please note that while coverholders may have been approved by Lloyd's to accept business from the regions shown:
</p>
<p>
it is the responsibility of the parties, including the coverholder and any Lloyd's managing agent appointing them to ensure that the coverholder complies with all local regulatory and legal requirements; and
</p>
<p>
the coverholder may not provide cover for all classes they are approved to underwrite in all territories where they have approval.
</p>
</li>
</ul>
</li>
<li>
<div class="contact-details">
<h2>
ABCO Insurance Underwriters Inc
</h2>
<br/>
<address>
ABCO Building, 350 Sevilla Avenue, Suite 201
<br/>
Coral Gables
<br/>
Florida
<br/>
U S A
<br/>
33134
</address>
<p>
<a href="http://www.abcoins.com">
www.abcoins.com
</a>
</p>
</div>
<span data-toggle=".info-cov-1">
Additional trading information
<i class="icon plus">
</i>
</span>
<ul class="result-info info-cov-1 cc">
<li>
<strong>
Accepts Business From:
</strong>
<ul class="cc">
<li>
U.S.A
</li>
</ul>
</li>
<li>
<strong>
Classes of business
</strong>
<ul class="cc">
<li>
Property D&F (US binder)
</li>
<li>
Terrorism
</li>
</ul>
</li>
<li>
<strong>
Disclaimer:
</strong>
<p>
Please note that while coverholders may have been approved by Lloyd's to accept business from the regions shown:
</p>
<p>
it is the responsibility of the parties, including the coverholder and any Lloyd's managing agent appointing them to ensure that the coverholder complies with all local regulatory and legal requirements; and
</p>
<p>
the coverholder may not provide cover for all classes they are approved to underwrite in all territories where they have approval.
</p>
</li>
</ul>
</li>
</ul>
</div>
我正在从此 HTML 中获取多个数据点。给我带来麻烦的是“接受业务来自:”和“业务类别”值。我可以通过以下方式获取“接受业务:”值,无论它以何种顺序出现:
try:
li_area = company.find('ul', class_='result-info info-cov-' +
str(company_counter) + ' cc')
li_stuff = li_area.find_all('li')
for li in li_stuff:
if li.strong.text.strip() == 'Accepts Business From:':
business_final = li.find('li').text.strip()
except AttributeError:
pass
注意:“company”变量是 beautifulsoup 对象,其中包含我上面粘贴的 html。
注意:页面上每条记录的类名都会发生变化 - 为了保持简洁,我在 HTML 示例中只包含了一条记录。
当我尝试相同的代码块时,这次替换了 li.strong.text.strip() == 'Accepts Business From:'
与 'Classes of business'
但代码似乎没有检测到那个强标签,只是检测到“接受业务来自:”。我的 for 循环是否不正确,并且实际上没有迭代每个 <li>
包含这些不同强标签的标签?这个强标签的真正值(value)是否不同于“业务类别”? (我确实直接从网站的 html 复制了该值)。
非常感谢您能提供的任何帮助
最佳答案
您收到 'Accepts Business From:'
的短信的原因而不是'Classes of business'
是您正在使用 try-except
在错误的地方。
在 for li in li_stuff:
的第二次迭代中循环,li
变成<li>U.S.A</li>
,这将抛出和 AttributeError
调用li.strong
因为没有<strong>
存在标签。并且,根据您当前的try-except
,错误在 for
之外被捕获循环,是 pass
编辑。因此,循环不会到达第三次迭代,在第三次迭代中它应该获取“Classes of Business”文本。
要在捕获错误后继续循环,请使用:
for li in li_stuff:
try:
if li.strong.text.strip() == 'Accepts Business From:':
business_final = li.find('li').text.strip()
print('Accepts Business From:', business_final)
if li.strong.text.strip() == 'Classes of business':
business_final = li.find('li').text.strip()
print('Classes of business:', business_final)
except AttributeError:
pass # or you can use 'continue' too.
输出:
Accepts Business From: U.S.A
Classes of business: Engineering
但是,由于“业务类别”存在许多值,您可以将代码更改为此以获取所有值:
if li.strong.text.strip() == 'Classes of business':
business_final = ', '.join([x.text.strip() for x in li.find_all('li')])
print('Classes of business:', business_final)
输出:
Accepts Business From: U.S.A
Classes of business: Engineering, NM General Liability (US direct), Property D&F (US binder), Terrorism
关于python - Beautifulsoup4 - 通过强标签值识别信息仅适用于标签的某些值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49018025/
我使用的是linux的windows子系统,安装了ubuntu,bash运行流畅。 我正在尝试使用make,似乎bash 无法识别gcc。尝试将其添加到 PATH,但没有任何改变。奇怪的是 - cmd
ImageMagick 已正确安装。 WAMP 的“PHP 扩展”菜单也显示带有勾选的 php_imagick。除了 Apache 和系统环境变量外,phpinfo() 没有显示任何 imagick
我是这么想的,因为上限是 2^n,并且考虑到它们都是有限机,n 状态 NFA 和具有 2^n 或更少状态的 DFA 的交集将是有效。 我错了吗? 最佳答案 你是对的。 2^n 是一个上限,因此生成的
我有一个大型数据集,其中包含每日值,指示一年中的特定一天是否特别热(用 1 或 0 表示)。我的目标是识别 3 个或更多特别炎热的日子的序列,并创建一个包含每个日子的长度以及开始和结束日期的新数据集。
我有一个向量列表,每个向量看起来像这样 c("Japan", "USA", "country", "Japan", "source", "country", "UK", "source", "coun
是否有任何工具或方法可以识别静态定义数组中的缓冲区溢出(即 char[1234] 而不是 malloc(1234))? 昨天我花了大部分时间来追踪崩溃和奇怪的行为,最终证明是由以下行引起的: // e
我一直在尝试通过导入制表符分隔的文件来手动创建 Snakemake 通配符,如下所示: dataset sample species frr PRJNA493818_GSE120639_SRP1628
我一直在尝试通过导入制表符分隔的文件来手动创建 Snakemake 通配符,如下所示: dataset sample species frr PRJNA493818_GSE120639_SRP1628
我想录下某人的声音,然后根据我获得的关于他/她声音的信息,如果那个人再次说话,我就能认出来!问题是我没有关于哪些统计数据(如频率)导致人声差异的信息,如果有人可以帮助我如何识别某人的声音? 在研究过程
我希望我的程序能够识别用户何时按下“enter”并继续循环播放。但是我不知道如何使程序识别“输入”。尝试了两种方法: string enter; string ent = "\n"; dice d1;
我创建了这个带有一个参数(文件名)的 Bash 小脚本,该脚本应该根据文件的扩展名做出响应: #!/bin/bash fileFormat=${1} if [[ ${fileFormat} =~ [F
我正在寻找一种在 for 循环内迭代时识别 subview 对象的方法,我基本上通过执行 cell.contentView.subviews 从 UITableView 的 contentView 获
我正在尝试在 Swift 中使用 CallKit 来识别调用者。 我正在寻找一种通过发出 URL 请求来识别调用者的方法。 例如:+1-234-45-241 给我打电话,我希望它向 mydomain.
我将(相当古老的)插件称为“thickbox”,如下所述: 创建厚盒时,它包含基于查询的内容列表。 使用 JavaScript 或 jQuery,我希望能够访问 type 的值(在上面的示例中 t
我想编写一些可以接受某种输入并将其识别为方波、三角波或某种波形的代码。我还需要一些产生所述波的方法。 我确实有使用 C/C++ 的经验,但是,我不确定我将如何模拟所有这些。最终,我想将其转换为微 Co
我创建了一个 for 循环,用于在每个部分显示 8 个项目,但我试图在循环中识别某些项目。例如,我想识别前两项,然后是第五项和第六项,但我的识别技术似乎是正确的。 for (int i = 0; i
如何识别 UIStoryboard? 该类具有创建和实例化的方法,但我没有看到带有类似name 的@property。例如 获取 Storyboard对象 + storyboardWithName:b
如何确定所运行的SQLServer2005的版本 要确定所运行的SQLServer2005的版本,请使用SQLServerManagementStudio连接到SQLServer2005,然后运行
这个问题在这里已经有了答案: How to check whether an object is a date? (26 个答案) 关闭2 年前。 我正在使用一个 npm 模块,它在错误时抛出一个空
我正在制作一个使用 ActivityRecognition API 在后台跟踪用户 Activity 的应用,如果用户在指定时间段(例如 1 小时)内停留在同一个地方,系统就会推送通知告诉用户去散步.
我是一名优秀的程序员,十分优秀!