gpt4 book ai didi

python - 在Python中复制嵌套的html列表?

转载 作者:太空宇宙 更新时间:2023-11-03 19:15:09 25 4
gpt4 key购买 nike

我是一名初学者程序员,所以这可能是一个微不足道的问题:我有一个带有深度嵌套无序列表的 .html 文件。例如我该如何复制在 Python 中将前 4 个嵌套级别放入新的空 .html 文件中?我需要 BeautifulSoup 吗?为了更好地说明,这里是Javascript中显示效果的代码:

function nestless(root, selector, level) {
var use = root;
for (var i = 0; i <= level; i++) {
use += ' ' + selector;
}
$(use).remove();
}

这里我会使用:

nestless('#root', 'ul', 4);

看来我原来的问题写得很糟糕并且难以解析,对此我感到抱歉。 .html 文件并不是真正的网站,而是手动编写的文本文档在 html 编辑器中并保存为 .html。它们不包含任何无法使用 LaTeX 编辑器编写的内容。

例如,如果我想将此列表列表减少到前 2 个级别:

  • 一个
  • B
    • C
    • D
      • E
      • F
  • G

  • 一个
  • B
    • C
    • D
  • G

根据我自己的研究,BeautifulSoup+soupselect、PyQuery 或 lxml 中有通过 CSS 选择器的 .html 解析器,但我不确定什么是最简单的继续的方式或从哪里开始阅读。

最佳答案

我会看看机械化 http://wwwsearch.sourceforge.net/mechanize/进行 html 解析以获取实际列表本身。尽量不要为此使用正则表达式,因为它会变得非常困惑并且只会让事情变得更加困难。

关于python - 在Python中复制嵌套的html列表?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11582783/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com