Python + BS 从网页表中选取一个特定的词(位置)-6ren

Python + BS 从网页表中选取一个特定的词(位置)

转载作者：太空宇宙更新时间：2023-11-04 03:31:57

28

4

大家好……我想从网页上的表格中选择一个关于特定位置的词。源代码如下:

table = '''
<TABLE class=form border=0 cellSpacing=1 cellPadding=2 width=500>
<TBODY>
<TR>
<TD vAlign=top colSpan=3><IMG class=ad src="/images/ad.gif" width=1     height=1></TD></TR>
<TR>
<TH vAlign=top width=22>Code:</TH>
<TD class=dash vAlign=top width=5 lign="left">&nbsp;</TD>
<TD class=dash vAlign=top width=30 align=left><B>BAN</B></TD></TR>
<TR>
<TH vAlign=top>Color:</TH>
<TD class=dash vAlign=top align=left>&nbsp;</TD>
<TD class=dash vAlign=top align=left>White</TD></TR>
<TR>
<TD colSpan=3>&nbsp;</TD></TR></TBODY></TABLE>

'''

我想在这里选择颜色词(可以是“白色”、“红色”或其他)。我尝试的是:

soup = BeautifulSoup(table)

for a in soup.find_all('table')[0].find_all('tr')[2:3]:
    print a.text

它给出:

Color:
 
White

它看起来像 4 行。我尝试将它们添加到列表中，然后删除不需要但不成功的。

只选择表格中颜色的最佳方法是什么？

非常感谢。

最佳答案

这将匹配 'white' 的所有实例，不区分大小写 ...

soup = BeautifulSoup(table)

res = []
for a in soup.find_all('table')[0].find_all('tr')[2:3]:
    if 'white' in a.text.lower():
        text = a.text.encode('ascii', 'ignore').replace(':','').split()
        res.append(text)

稍微好一点的实现...

# this will iterate through all 'table' and 'tr' tags within each 'table'
res = [tr.text.encode('ascii', 'ignore').replace(':','').split() \
        for table in soup.findAll('table') for tr in table.findAll('tr') \
        if 'color' in tr.text.lower()]

print res
[['Color', 'White']]

只返回颜色本身，做...

# Assuming the same format throughout the html
# if format is changing just add more logic
tr.text.encode('ascii', 'ignore').replace(':','').split()[1]
...
print res
['White']

关于Python + BS 从网页表中选取一个特定的词(位置)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/30795380/

28

4

0

文章推荐： jquery - 从 AJAX 调用返回 render_to_response

文章推荐： c - 执行带有参数的 SQLite 语句

文章推荐： c - MPI 发送和接收死锁

文章推荐： python - 如何在文件中搜索值并替换

typescript - 用于删除未定义项的过滤器未被 TypeScript 选取
在下面的代码中，我想不必添加undefined作为filteredDevice的类型注解。我认为一个被过滤的设备不应该是未定义的，因为我过滤掉了未定义的设备。但是如果我删除 undefined类型注
iphone - 选取 UIButton 的文字
我有一个 UIButton，其文本来自服务器。按钮的宽度是固定的。我想要的是，如果按钮的文本超过按钮的宽度，文本应该在按钮内选取框。如果文本适合按钮宽度，则不应有选取框效果。我点击了一些链接(one
3d - webgl 和 glsl 选取
我正在从头开始实现 webgl 选取，并决定走 GLSL 路线，而不是光线相交测试。所以我将整个场景渲染到一个单独的帧缓冲区中，为每个对象分配一个唯一的颜色，该颜色作为统一变量传递给片段着色器。当场
javascript - 随机化数组，选取 2 个随机对象，然后填充一个新数组？
例如，我有包含多个对象的数组， var arr = ["a", "b", "c", "d"]; 我想要的是从该数组中选取 2 个随机对象，例如“a”和“c”，并将这 2 个对象推送到另一个数组中，例如

首页

博学

6Ren·AI

商城

Python + BS 从网页表中选取一个特定的词(位置)