python - 分隔 <pre> 标签内的文本-6ren

python - 分隔

 标签内的文本

转载作者：太空宇宙更新时间：2023-11-04 09:35:04

28

4

我想尝试一些基本的网络抓取，但遇到了一个问题，因为我习惯了简单的 td-tags，在这种情况下，我有一个网页，其中包含以下预标记和其中的所有文本，这意味着刮掉它有点棘手。

<pre style="word-wrap: break-word; white-space: pre-wrap;">
11111111
11111112
11111113
11111114
11111115
</pre>

关于如何抓取每一行有什么建议吗？

谢谢

最佳答案

如果这正是您想要解析的内容，您可以使用splitlines()轻松获取行列表的功能，或者您可以调整 split()像这样的功能。

from bs4 import BeautifulSoup

content = """
<pre style="word-wrap: break-word; white-space: pre-wrap;">
11111111 
11111112 
11111113
11111114
11111115 
</pre>""" # This is your content

soup = BeautifulSoup(content, "html.parser")
stuff = soup.find('pre').text
lines = stuff.split("\n") # or replace this by stuff.splitlines()
# print(lines) gives ["11111111", "11111112", "11111113", "11111114", "11111115"]
for line in lines:
    print(line)
# prints each row separately.

关于python - 分隔 <pre> 标签内的文本，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/54074831/

28

4

0

文章推荐： linux - shell 脚本 - 将一个变量分配给另一个 - 数组

文章推荐： java - 将图像从表单加载到 RecyclerView

文章推荐： linux - 使用 bash 查找两个文件之间的差异

文章推荐： java - 如何为特定联系人设置自定义铃声？

首页

博学

6Ren·AI

商城

python - 分隔
标签内的文本

标签)？
根据 Web 标准，创建带有标题 1 的链接的正确代码是什么？是吗 stackoverflow 或 stackoverflow 谢谢最佳答案根据网络标准，您不能将 block 元素放入内

首页

博学

6Ren·AI

商城

python - 分隔 标签内的文本

标签)？ 根据 Web 标准，创建带有标题 1 的链接的正确代码是什么？ 是吗 stackoverflow 或 stackoverflow 谢谢 最佳答案 根据网络标准，您不能将 block 元素放入内

python - 分隔
标签内的文本

标签)？
根据 Web 标准，创建带有标题 1 的链接的正确代码是什么？是吗 stackoverflow 或 stackoverflow 谢谢最佳答案根据网络标准，您不能将 block 元素放入内