作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试创建一种从以下 html 中提取文本的特定方法。
</table>
<table border="0" cellpadding="0" cellspacing="0">
<tr>
<td>Close Date:</td>
<td> June 19, 2008</td>
我的问题是为什么会这样:
soup.find('td', text=re.compile('Close'))
返回:
<td>Close Date:</td>
但是,当我尝试做更具体的事情时,它什么也没有返回。
soup.find('td', text=re.compile('Close Date:'))
我想让脚本尽可能具体,以便我可以在多个网页上运行它,而不会出现错误的文本。
最佳答案
Close
和 Date
之间可能存在不间断空格。在这种情况下,您可以使用 \s+
来匹配 1 个或多个空格:
print(soup.find('td', text=re.compile('Close\s+Date:')))
<小时/>
例如,
import re
import bs4 as bs
content = '''\
<table border="0" cellpadding="0" cellspacing="0">
<tr>
<td>Close Date:</td>
<td> June 19, 2008</td>
'''
soup = bs.BeautifulSoup(content, 'lxml')
print(soup.find('td', text=re.compile('Close\s+Date:')))
产量
<td>Close Date:</td>
关于python - BeautifulSoup4 soup.find ('tag' , text=re.compile ('my text' )) 仅有时有效,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41411443/
我想知道。是否有仅将按引用传递作为评估策略的语言? 最佳答案 我不知道什么是“评估策略”,但是Perl子例程调用仅通过引用传递。 sub change { $_[0] = 10; } $x =
我是一名优秀的程序员,十分优秀!