- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个巨大的网址列表,其中包含指向亚马逊产品的链接,该网址包含我需要的信息,称为 ASIN 编号。
我知道提取该信息的最佳方法之一是通过正则表达式,我在网址中发现了一种可以提供帮助的模式
相应的 ASIN 编号为:
1- B07P4LVZNL,位于:dp/B07P4LVZNL/ref=sr_1_f
2- B07DXPN7TK,位于:dp/B07DXPN7TK/ref=sr_1_fkmr2_
3- B07R23QGH6,位于:gp/B07R23QGH6/ref=sr_1_fkmr2_
我尝试了这段代码:
asin = re.match("http[s]?://www.amazon.com(\w+)(.*)/(dp|gp/product)/(?P<asin>\w+).*", href, flags=re.IGNORECASE)
href 是我存储网址的变量
但是......它效果不太好,这是我得到的结果类型:
<re.Match object; span=(0, 175), match='https://www.amazon.com/adidas-Originals-Solid-Mel>
<re.Match object; span=(0, 171), match='https://www.amazon.com/adidas-Game-Mode-Polo-Mult>
<re.Match object; span=(0, 167), match='https://www.amazon.com/adidas-Tech-Tee-Black-X-La>
感谢您的帮助
最佳答案
我建议使用
/[dg]p/([^/]+)
它匹配 /dp/
或 /gp/
,然后将 /
之外的任何一个或多个字符捕获到第 1 组中。
请参阅regex demo 。在 Python :
asin = re.search(r'/[dg]p/([^/]+)', href, flags=re.IGNORECASE)
if asin:
print(asin.group(1))
关于python - 从 URL、RE、python 中提取 Amzon ASIN,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59857225/
我正在通过 Java Eclipse 创建 Amazon Stack。 下面的代码行抛出错误 csr.setTemplateURL("https://s3.amazonaws.com/cloudfor
在企业分发的情况下,我们可以使用我们自己的支付集成,如 Paypal 或亚马逊结账(不包括应用内购买)。我们是否需要满足任何特定标准才能进行内部分销? 最佳答案 从技术上讲,您没有理由不能集成自己的付
我有一个巨大的网址列表,其中包含指向亚马逊产品的链接,该网址包含我需要的信息,称为 ASIN 编号。 我知道提取该信息的最佳方法之一是通过正则表达式,我在网址中发现了一种可以提供帮助的模式 1- ht
我是一名优秀的程序员,十分优秀!