gpt4 book ai didi

python - 为什么 Beautiful soup 会在文档中添加额外的 xml 声明以及如何删除它?

转载 作者:太空宇宙 更新时间:2023-11-03 17:04:04 24 4
gpt4 key购买 nike

我试图解析一个带有 header 的简单 xml。这是代码:

str(BeautifulSoup("""
<?xml version="1.0" encoding="UTF-8"?>
<data/>
""", features='xml'))

输出已填充:

<?xml version="1.0" encoding="utf-8"?>
<?xml version="1.0" encoding="UTF-8"><data/>

正如我们所看到的,有一个额外的 header ,而且它的格式也不正确。这是一个错误还是我做错了什么?

版本:

beautifulsoup4==4.4.1
lxml==3.4.3

最佳答案

当您将 xml 传递给 features 参数时,lxml 会自行构建 xml 树。所以你不需要自己添加标题。

>>> str(BeautifulSoup("""
... <data/>
... """, features='xml'))
'<?xml version="1.0" encoding="utf-8"?>\n<data/>'

>>>

关于python - 为什么 Beautiful soup 会在文档中添加额外的 xml 声明以及如何删除它?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34743438/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com