javascript正则表达式从 anchor 标签中提取 anchor 文本和URL-6ren

javascript正则表达式从 anchor 标签中提取 anchor 文本和URL

转载作者：可可西里更新时间：2023-11-01 01:35:11

24

4

我在名为“input_content”的 javascript 变量中有一段文本，该文本包含多个 anchor 标记/链接。我想匹配所有 anchor 标记并提取 anchor 文本和 URL，并将其放入类似(或类似)的数组中:

Array(    [0] => Array        (            [0] => <a href="http://yahoo.com">Yahoo</a>            [1] => http://yahoo.com            [2] => Yahoo        )    [1] => Array        (            [0] => <a href="http://google.com">Google</a>            [1] => http://google.com            [2] => Google        ))

我已经破解了它 ( http://pastie.org/339755 )，但我对这一点感到困惑。感谢您的帮助!

最佳答案

var matches = [];

input_content.replace(/[^<]*(<a href="([^"]+)">([^<]+)<\/a>)/g, function () {
    matches.push(Array.prototype.slice.call(arguments, 1, 4))
});

这假设您的 anchor 将始终采用 <a href="...">...</a> 的形式也就是说，如果有任何其他属性(例如 target )，它将不起作用。可以改进正则表达式以适应这一点。

分解正则表达式:

/ -> start regular expression  [^<]* -> skip all characters until the first <  ( -> start capturing first token    <a href=" -> capture first bit of anchor    ( -> start capturing second token        [^"]+ -> capture all characters until a "    ) -> end capturing second token    "> -> capture more of the anchor    ( -> start capturing third token        [^<]+ -> capture all characters until a <    ) -> end capturing third token    <\/a> -> capture last bit of anchor  ) -> end capturing first token/g -> end regular expression, add global flag to match all anchors in string

Each call to our anonymous function will receive three tokens as the second, third and fourth arguments, namely arguments[1], arguments[2], arguments[3]:

arguments[1] is the entire anchor
arguments[2] is the href part
arguments[3] is the text inside

We'll use a hack to push these three arguments as a new array into our main matches array. The arguments built-in variable is not a true JavaScript Array, so we'll have to apply the split Array method on it to extract the items we want:

Array.prototype.slice.call(arguments, 1, 4)

这将从 arguments 中提取项目从索引 1 开始到索引 4 结束(不包括在内)。

var input_content = "blah \
    <a href=\"http://yahoo.com\">Yahoo</a> \
    blah \
    <a href=\"http://google.com\">Google</a> \
    blah";

var matches = [];

input_content.replace(/[^<]*(<a href="([^"]+)">([^<]+)<\/a>)/g, function () {
    matches.push(Array.prototype.slice.call(arguments, 1, 4));
});

alert(matches.join("\n"));

给予:

<a href="http://yahoo.com">Yahoo</a>,http://yahoo.com,Yahoo<a href="http://google.com">Google</a>,http://google.com,Google

关于javascript正则表达式从 anchor 标签中提取 anchor 文本和URL，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/369147/

24

4

0

文章推荐： java - 为 Java GUI 选择布局管理器和面板数量

文章推荐： javascript - 更改 TinyMCE 中的默认字体系列

文章推荐： javascript - 在下拉更改时运行 jQuery 函数

javascript - anchor 悬停每个 anchor ，除了一个悬停的 anchor 改变颜色
当用户将鼠标悬停在 anchor 上时，除了悬停的 anchor 之外的每个 anchor 都会改变颜色。假设有 link1 link2 link3。如果用户将鼠标悬停在 link1 上，我希望更改
javascript - anchor 上的动态ID不会在其他 anchor 上触发最后一个 anchor php js pdo
'; echo "".$value['eventsearchresultwhat'].""; echo "\n"; echo $value['eventsearchr
html - 位于 anchor 文本上方的 anchor 命中区域 - 需要它表现得像默认 anchor 命中区域一样
我有几个多列下拉菜单作为我的主导航的一部分。由于某种原因，两个多列下拉菜单中每个链接周围的 anchor 命中区域位于链接本身上方。我该如何修复它，使点击区域像普通 anchor 一样以链接文本为中心
java - 如何在 ARcore 的帮助下相对于一个 anchor 定位 anchor /节点/ anchor 节点？
我正在 android studio 中创建内部构建 AR 导航。我正在寻找一种方法将 anchor 与其他 anchor 或 anchor 节点/节点“连接”起来。我不确定使用哪一个。基于我将强制用
anchor - doxygen 中的编号 anchor
我有很多 anchor 可以在 doxygen 中描绘，例如 \anchor pic_foo \image html foo.gif "My Caption" \anchor pic_bar \ima
javascript - anchor 上的随机背景颜色只获得第一个 anchor ？
我有 3 个 anchor block ，当我加载页面时，我需要 3 个不同的随机 background-colors。然而，只有第一个 anchor 随机改变 background-color。这是
html - anchor 链接直接指向偏移了多个像素的 anchor ？
我有一个带有 float 顶部导航栏的网页。我想将 anchor 链接添加到目录以快速定向到页面上的其他位置。 #top { display: flex; z-index: 100; ba
html - 为什么将 anchor 标签的text-align设置为右对齐，移动 anchor 标签内的span标签，移出 anchor 标签
我无法理解为什么将 text-align 属性设置为 right 值，将 span 标签移出 anchor 标签区域(溢出)？ HTML文件的结构 a.btn{ border: 1px solid
javascript - 如何选择具有 active=true 属性的 anchor ，添加一个类，如果用户选择其他 anchor ，则将该类赋予新 anchor 。
我需要使用 Jquery 将类“Selected”添加到一个 anchor ，捕获它的唯一方法是通过其属性“active=true”。然后，当用户选择其他 anchor 时，新 anchor 将被设置
javascript - jQuery 使用 anchor 的类名将 anchor 的 href 值动态设置为另一个 anchor 的 href 值
我在 hubspot 上有一个基于搜索词查询动态生成的搜索列表页面。 HTML结构如下: a class="hs-search-results__title" href="www.somethi
javascript - JS/Flash - 拖动包含 img 的 anchor vs 拖动不带 anchor 的图像 - 如何获取 anchor 内的 img？
标题隐晦，但很难解释。使用 Firefox，前往 http://images.google.com进行随机搜索，然后将第一个搜索结果拖到地址栏。您会看到它转到具有图像 anchor 的页面。然后单击“
vue.js - Vue路由器导航或滚动到 anchor (# anchor )
我正在为 vue-router 不滚动/导航到 anchor 标签(例如:#anchor)而苦苦挣扎。我在 Stack Overflow 上阅读了各种解决方案，但到目前为止都没有奏效。请在下面找到我
anchor - 是否可以将 Cloud Anchor 保存到本地存储以备后用？
我正在制作 AR 应用程序。要求很简单。在“配置阶段”，我启动应用程序并将一个立方体放在房间的地板上，然后关闭它。稍后当我再次启动应用程序时，当相机面向同一楼层时，立方体应该留在那里。根据我发现的信息
javascript - 如何将一个 anchor 的href链接复制到其他 anchor ？
我正在 WordPress 中通过简码展示一组产品。显示屏上有图像和按钮。问题:只有照片包含指向单个产品页面的链接。关联的按钮没有指向单个产品页面的链接。这是当前代码:
javascript - 触发 anchor ，打开模态框并转到模态框内的 anchor
我正在尝试做一件奇怪的事情。我将解释一般情况，然后按照我想要执行的步骤进行。我有一个内的项目列表。当我按下一个元素时，必须打开一个模式。在这个模态中，有与相同的元素。但详细解释了。当模式打开时
Javascript从 anchor 克隆文本并添加到同一 anchor 的属性
尝试从 anchor 克隆文本并将其设置为同一 anchor 的标题属性，但不了解如何使用正确语法的逻辑。 $(document).ready(function () { $('.desc a').c
anchor - 跨 YAML 文件导出 anchor
--- #File A - Lunch: &01 - Chicken - Rice - Sallad ... --- #File B - Mon
android - 如何将对象从一个 anchor 移动到另一个 anchor ？
我的用例是: 点击屏幕并将“点”保存为起始 anchor 第二次点击屏幕并将“点”保存为结束 anchor 按下按钮将对象从开始 anchor 移动到结束 anchor 我已经构建了自己的节点，该节点
javascript - anchor 导航与粘在顶部菜单...需要添加动态偏移到 anchor
我的菜单和基于#anchors 的导航有问题。我正在使用 JS 函数在滚动时将菜单置于顶部(#stickyheader)。我的菜单上有一个 div，滚动时会消失(#unstickyheader)。该
javascript - 淡化除具有类别的特定 anchor 之外的所有 anchor
我目前有这个基础页面淡入淡出脚本函数，当前针对所有 anchor ('a')，但不确定如何准确排除具有类(.noFade)的某个 anchor 淡出。 JS: $(document).ready(fu

首页

博学

6Ren·AI

商城

javascript正则表达式从 anchor 标签中提取 anchor 文本和URL