gpt4 book ai didi

python - 如何使用pyquery解析HTML表格?

转载 作者:太空宇宙 更新时间:2023-11-04 10:40:56 24 4
gpt4 key购买 nike

如何使用pyquery解析HTML表格? [参见 http://pastie.org/pastes/8556919 上的源代码 html 表

结果:{

"category_1":{ "cat1_el1_label":"cat1_el1_value",},

"category_2":{"cat2_el1_label":"cat2_el1_value",},

"category_3":{"cat3_el1_label":"cat3_el1_value",}

非常感谢。

最佳答案

简单的方法:

from pyquery import PyQuery
from collections import defaultdict

doc = PyQuery(html)
values = defaultdict(dict)
for tr in doc('tr').items():
if tr('th.title'):
title = tr('th.title').text()
else:
items = zip(tr('.properties_label').items(),
tr('.properties_value').items())
values[title].update(dict([(k.text(), v.text()) for k, v in items]))

结果:

defaultdict(<type 'dict'>, {'Category_3': {'cat3_el1_label': 'cat3_el1_value'},
'Category_2': {'cat2_el1_label': 'cat2_el1_value'},
'Category_1': {'cat1_el1_label': 'cat1_el1_value'}})

关于python - 如何使用pyquery解析HTML表格?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20622811/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com