gpt4 book ai didi

Python 模式匹配

转载 作者:行者123 更新时间:2023-11-28 20:28:46 26 4
gpt4 key购买 nike

我目前正在将我的旧 bash 脚本转换为具有附加功能的 Python 脚本。我已经能够做大部分事情,但我在 Python 模式匹配方面遇到了很多麻烦。

在我之前的脚本中,我下载了一个网页并使用 sed 来获取我想要的元素。匹配是这样完成的(对于我想要的值之一):

PM_NUMBER=`cat um.htm | LANG=sv_SE.iso88591 sed -n 's/.*ol.st.*pm.*count..\([0-9]*\).*/\1/p'`

它将匹配包裹在<span class="count"></span> 中的数字在短语“olästa pm”之后。我正在运行的标记是:

<td style="padding-left: 11px;">
<a href="/abuse_list.php">
<img src="/gfx/abuse_unread.png" width="15" height="12" alt="" title="9 anmälningar" />
</a>
</td>
<td align="center">
<a class="page_login_text" href="/pm.php" title="Du har 3 olästa pm.">
<span class="count">3</span>
</td>
<td style="padding-left: 11px;" align="center">
<a class="page_login_text" href="/blogg_latest.php" title="Du har 1 ny bloggkommentar">
<span class="count">1</span>
</td>
<td style="padding-left: 11px;" align="center">
<a class="page_login_text" href="/user_guestbook.php" title="Min gästbok">
<span class="count">1</span>
</td>
<td style="padding-left: 11px;" align="center">
<a class="page_login_text" href="/forum.php?view=3" title="Du har 1 ny forumkommentar">
<span class="count">1</span>
</td>
<td style="padding-left: 11px;" align="center">
<a class="page_login_text" href="/user_images.php?user_id=162005&func=display_new_comments" title="Du har 1 ny albumkommentar">
<span class="count">1</span>
</td>
<td style="padding-left: 11px;" align="center">
<a class="page_login_text" href="/forum_favorites.php" title="Du har 2 uppdaterade trådar i &quot;bevakade trådar&quot;">
<span class="count">2</span>
</td>

我犹豫要不要发布这个,因为看起来我的要求很多,但是有人可以帮我用 Python 解析这个吗?我一直在努力尝试这样做,但正则表达式和我不匹配(请原谅双关语)。在过去的几个小时里,我一直在试验和阅读有关正则表达式的 Python 手册,但我似乎无法弄明白。

为了清楚起见,我需要 7 个不同的表达式来匹配 <span class="count"></span> 中的数字.例如,我需要能够找到未读 PM(“olästa pm”)的数量。

最佳答案

您不会自己解析 html。您将使用 python 中内置的 html 解析器来解析 html。

关于Python 模式匹配,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4227637/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com