gpt4 book ai didi

python - 使用 HTMLParser 提取数据

转载 作者:行者123 更新时间:2023-11-28 22:48:07 24 4
gpt4 key购买 nike

<tr>
<td style="color: #0000FF;text-align: center"><p>Sam<br/>John<br/></p></td>
</tr>

我正在使用 python HTMLParser module从下面的 html 片段中提取值 Sam 和 John,但是 handle_data 函数只捕获 Sam 而不是 John。

我怎样才能同时获得 Sam 和 John?

最佳答案

您可以拥有一个具有 True/False 值的实例级变量。如果 p 标签开始,则将其设置为 True,如果 p 标签结束,则将其设置为 False。当值为True时,获取handle_data()方法中的数据:

from HTMLParser import HTMLParser

data = """
<tr>
<td style="color: #0000FF;text-align: center"><p>Sam<br/>John<br/></p></td>
</tr>
"""

class Parser(HTMLParser):
def __init__(self):
HTMLParser.__init__(self)
self.recording = False

def handle_starttag(self, tag, attrs):
if tag == 'p':
self.recording = True

def handle_endtag(self, tag):
if tag == 'p':
self.recording = False

def handle_data(self, data):
if self.recording:
print data

parser = Parser()
parser.feed(data)

打印:

Sam
John

关于python - 使用 HTMLParser 提取数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25447758/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com