gpt4 book ai didi

python - 正则表达式匹配错误

转载 作者:太空狗 更新时间:2023-10-29 21:09:11 25 4
gpt4 key购买 nike

我是 Python 的新手(我也没有接受过任何编程培训),所以在我提问时请记住这一点。

我正在尝试搜索检索到的网页并使用指定模式查找所有链接。我已在其他脚本中成功完成此操作,但出现错误

raise error, v # invalid expression

sre_constants.error: multiple repeat

我不得不承认我不知道为什么,但我又是 Python 和正则表达式的新手。但是,即使我不使用模式并使用特定链接(只是为了测试匹配),我也不相信我会返回任何匹配项(当我打印 match.group(0) 时没有任何内容发送到窗口。链接我测试在下面被注释掉了。

有什么想法吗?通过示例学习通常对我来说更容易,但非常感谢您提供的任何建议!

布洛克

import urllib2
from BeautifulSoup import BeautifulSoup
import re

url = "http://forums.epicgames.com/archive/index.php?f-356-p-164.html"
page = urllib2.urlopen(url).read()
soup = BeautifulSoup(page)

pattern = r'<a href="http://forums.epicgames.com/archive/index.php?t-([0-9]+).html">(.?+)</a> <i>((.?+) replies)'
#pattern = r'href="http://forums.epicgames.com/archive/index.php?t-622233.html">Gears of War 2: Horde Gameplay</a> <i>(20 replies)'

for match in re.finditer(pattern, page, re.S):
print match(0)

最佳答案

这意味着你的正则表达式有错误。

(.?+)</a> <i>((.?+)

?+ 是什么意思?两个都 ?和 + 是没有意义的元字符。也许你忘了转义 '?'什么的。

关于python - 正则表达式匹配错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1268761/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com