gpt4 book ai didi

javascript - 如何在网站上使用 BeautifulSoup 或 Slimit 从 javascript 变量输出电子邮件地址

转载 作者:行者123 更新时间:2023-11-28 07:43:49 26 4
gpt4 key购买 nike

我有这个示例网站:http://www.example.com/whatever.asp?profile=1

对于每个个人资料号码,我在此 Java 脚本代码中都有一个不同的电子邮件。

<script LANGUAGE="JavaScript">
function something()
{
var ptr;
ptr = "";
ptr += "<table><td class=france></td></table>";
ptr += "<table><td class=france><a href=mailto:exa";
ptr += "mple@email.com>email</a></td></table>";
document.all.something.innerHTML = ptr;
}
</script>

我想解析或正则表达式电子邮件地址。电子邮件的位置取决于长度。然而,只有这个 python 代码我可以解析 mple@email.com 而不是 example@email.com

url=urllib.urlopen('http://www.example.com/whatever.asp?profile=1')
contents= url.read()
soup = BeautifulSoup(contents)
js_content= soup.findAll("script")[0].text
reg = '(<)?(\w+@\w+(?:\.\w+)+)(?(1)>)'
match= re.search(reg,js_content)
print match.group()

有什么帮助吗?谢谢。

最佳答案

我建议您使用 re.findall 而不是 re.search,因为搜索只会返回第一个匹配项。

url=urllib.urlopen('http://www.example.com/whatever.asp?profile=1')
contents= url.read()
soup = BeautifulSoup(contents)
js_content= soup.findAll("script")[0].text
reg = r'<?(\w+@\w+(?:\.\w+)+)>?'
match= re.findall(reg,js_content)

关于javascript - 如何在网站上使用 BeautifulSoup 或 Slimit 从 javascript 变量输出电子邮件地址,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27682751/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com