gpt4 book ai didi

javascript - 从 python 中的标签名称中抓取数据

转载 作者:太空宇宙 更新时间:2023-11-03 17:12:21 24 4
gpt4 key购买 nike

您好,我正在尝试从网站上抓取用户数据。我需要标签名称本身中提供的用户 ID。我正在尝试使用 python selenium 和 div 标签中的 beautiful soup 来抓取 UID。

示例:

<"div id="UID_**60CE07D6DF5C02A987ED7B076F4154F3**-SRC_328619641" class="memberOverlayLink" onmouseover="ta.trackEventOnPage('Reviews','show_reviewer_info_window','user_name_photo'); ta.call('ta.overlays.Factory.memberOverlayWOffset', event, this, 's3 dg rgba_gry update2012', 0, (new Element(this)).getElement('.avatar')&amp;&amp;(new Element(this)).getElement('.avatar').getStyle('border-radius')=='100%'?-10:0);">

我正在尝试使用 python selenium 和 div 标签中的 beautiful soup 来抓取 UID 。我浏览了所有文档和几个网页,但找不到解决方案。如果有人可以告诉我这样的事情是否可能,我将非常感激。

最佳答案

假设 id 属性值始终采用 UID_ 格式,后跟一个或多个字母数字字符,后跟 -SRC_ 后跟一个或更多数字:

import re
from bs4 import BeautifulSoup

soup = BeautifulSoup(html)

pattern = re.compile(r"UID_(\w+)\-SRC_\d+")
id = soup.find("div", id=pattern)["id"]

uid = pattern.match(id).group(1)
print(uid)

这里我们使用 BeautifulSoup 并搜索 id attribute value to match a specific regular expression 。它包含 saving group (\w+) 帮助我们提取 UID 值。

关于javascript - 从 python 中的标签名称中抓取数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33973629/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com