作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有动态生成的字符串,其中包含 HTML 链接。例如,字符串可能包含:
You can visit <a class="hyperlink" href="https://www.stackoverflow.com">Stack Overflow</a> or <a class="hyperlink" href="https://www.reddit.com">Reddit.com</a> for help, or you can visit <a href="hyperlink" href="https://www.google.com">https://www.google.com</a>
我正在尝试查找所有 href,而不是为它们生成新的 URL,然后将它们插入回字符串中。所以上面的例子,如果运行成功,看起来像:
You can visit <a class="hyperlink" href="https://mydomain.com/www.stackoverflow.com">Stack Overflow</a> or <a class="hyperlink" href="https://mydomain.com/reddit.com">Reddit.com</a> for help, or you can visit <a href="hyperlink" href="https://mydomain.com/www.google.com">https://www.google.com</a>
我是 Python 的新手,并没有成功地弄清楚如何找到 href 并将其值添加到我的“自定义”域中。任何见解将不胜感激!
最佳答案
这是使用正则表达式的最佳位置。
import re
text = 'You can visit <a class="hyperlink" href="https://www.stackoverflow.com">Stack Overflow</a>'
new_text = re.sub(r'href="http(s)?:\/\/(.+?)"', r'href="https://mydomain.com/\2"', text)
关于Python:为存储在字符串中的链接生成新的 URL,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15857014/
我是一名优秀的程序员,十分优秀!