gpt4 book ai didi

python - 在 Python 中使用 BeautifulSoup 提取 HTML 段落内的文本

转载 作者:可可西里 更新时间:2023-11-01 14:47:25 41 4
gpt4 key购买 nike

<p>
<a name="533660373"></a>
<strong>Title: Point of Sale Threats Proliferate</strong><br />
<strong>Severity: Normal Severity</strong><br />
<strong>Published: Thursday, December 04, 2014 20:27</strong><br />
Several new Point of Sale malware families have emerged recently, to include LusyPOS,..<br />
<em>Analysis: Emboldened by past success and media attention, threat actors ..</em>
<br />
</p>

这是我想在 Python 中使用 BeautifulSoup 从 HTML 页面中提取的一段。我可以使用 .children 和 .string 方法获取标签内的值。但是我无法在没有任何标记的段落内获取文本“几个新的销售点恶意软件 fa ...”。我尝试使用 soup.p.text 、 .get_text() 等。但没有用。

最佳答案

import urllib.request
from bs4 import BeautifulSoup

url = "https://www.geeksforgeeks.org/how-to-automate-an-excel-sheet-in-python/?ref=feed"

html = urllib.request.urlopen(url)

htmlParse = BeautifulSoup(html, 'html.parser')

for para in htmlParse.find_all("p"):
print(para.get_text())

关于python - 在 Python 中使用 BeautifulSoup 提取 HTML 段落内的文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27631968/

41 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com