- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我目前正在寻找一种替换网页中特定文本的方法,但我不想弄乱任何可能用作标记的内容(即 HTML 本身)。我研究了多种方法,包括匹配“<”和“>”字符(并忽略中间的内容),但不幸的是,当网页格式错误且它们不匹配或内容不匹配时,这种方法就会中断很差,或者在实际文本中嵌入了“<”或“>”。它也非常慢。
提取特定文本不是目标。相反,我需要用不同的文本替换它。
//编辑以使其更清楚(不确定为什么我对这个问题有两个 -1)。
1) 这是一个非常简单的例子
<head>
<title>This is my website</title>
<link rel="shortcut icon" href="//a.b.c">
<meta name="twitter:card" content="summary">
<meta property="og:type" content="website" />
<script src="//ajax.googleapis.com/ajax/libs/jquery/1.7.1/jquery.min.js"></script>
<script>
mystuff.ready(function () {
mystuff.using("snippets", function () {
mystuff.snippets.initSnippetRenderer();
});
});
</script>
</head>
<body class="question-page new-topbar">
<noscript><div id="noscript-padding"></div></noscript>
<div id="notify-container"></div>
<h1>This is piece of large text</h1>
<ul>
<li>Coffee</li>
<li>Tea</li>
<li>Milk</li>
</ul>
</body>
当您打开浏览器时,您希望在浏览器中看到的内容如下(我们称之为“感兴趣的文本”):
This is a Large Piece of Text* Coffee* Tea* Milk
因此,我感兴趣的关键是如何确定标签之外的内容(即感兴趣的文本并允许使用 RegEX 搜索和替换它)。
2). @Zaph - stringByReplacingOccurrencesOfString:withString:options:range 是不够的,因为它不能直接确定范围是什么。范围取决于文本是否包含在 HTML 标签中,或者负载是否由标签操作)- 请参见上面的“1”点。
例如,如果我直接替换文本“网站”,那么它将替换标题中的文本,但它也会错误地替换第二个元标记中的术语,这是不好的。
有什么想法,或者我可能想到的其他任何东西可以智能地与 HTML 负载而不是支持标签配合使用?
最佳答案
将正则表达式与后视断言和前视断言结合使用。
该示例将匹配的文本替换为自身,但包裹在邪恶的表情符号中。重点是演示匹配模式。使用 NSRegularExpression
以便更好地控制替换。
解释:
(?<=>) Must be preceded with: >
\\S Must start with a non-whitespace character (the \ has to be escaped)
[^<>]+ Must consist of characters except < and >
(?=</) Must be followed by </
NSString *html = <question html>;
NSString *pattern = @"(?<=>)\\S[^<>]+(?=</)";
NSString *replacement = @"😈$0👿";
html = [html stringByReplacingOccurrencesOfString:pattern
withString:replacement
options:NSRegularExpressionSearch
range:NSMakeRange(0, html.length)]
NSLog(@"html:\n%@", html);
输出:
<head>
<title>😈This is my website👿</title>
<link rel="shortcut icon" href="//a.b.c">
<meta name="twitter:card" content="summary">
<meta property="og:type" content="website" />
<script src="//ajax.googleapis.com/ajax/libs/jquery/1.7.1/jquery.min.js"></script>
<script>
mystuff.ready(function () {
mystuff.using("snippets", function () {
mystuff.snippets.initSnippetRenderer();
});
});
</script>
</head>
<body class="question-page new-topbar">
<noscript><div id="noscript-padding"></div></noscript>
<div id="notify-container"></div>
<h1>😈This is piece of large text👿</h1>
<ul>
<li>😈Coffee👿</li>
<li>😈Tea👿</li>
<li>😈Milk👿</li>
</ul>
</body>
关于html - 替换网页中的 'non-tagged'内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29589450/
我正在使用 gmock 并模拟了一个函数 boost::beast::http::response_parser作为输出参数。功能签名看起来像: error_code readFromSocket(b
我的任务是打印由“非元音、元音、非元音”组成的单词列表,即 bab、bac、bad、bad ... 到 zuz。 我已经设法创建了一个代码,它执行前两个字母,但在最后一个循环中丢失并只打印'}' -
我正在尝试使用 label2rgb 生成 RGB 标签切片并使用它来更新 RGB 体积,如下所示: labelRGB_slice=label2rgb(handles.label(:,:,han
我有一个很奇怪的问题。我在 dll 中定义了一个接口(interface),如下所示: public interface IKreator2 { string Name { get; set;
在我的 openshift Drupal 托管中,网络都在 SSL 下 http://domain.com -> https://www.domain.com 确定 http://www.domain
我收到警告“退出构造函数时不可为空的事件‘SomeEvent’必须包含非空值。考虑将事件声明为可空。” 这是我的代码的一个非常简化的版本,它复制了完全相同的问题。我在这里错过了什么?这与 .Net 6
在一次大学考试中,我被要求测试一些 apache 簿记员类/方法,在这样做的过程中,我想在我的参数化测试中使用 mockito。没有 mockito 的测试工作正常但是当我尝试模拟接口(interfa
假设 A 列在 7 行中有以下值: 2 [空白的] 0 -0.3 0 [空白的] 0 如何获取范围(7 行)中非空/空白且不为零的最后一个值?因此,在这种情况下,正确答案是 -0.3。 最佳答案 =I
考虑以下受 this talk 启发的代码: template struct even_common_type_helper_impl; template struct even_common_typ
考虑这段代码, struct A {}; struct B { B(const A&) {} }; void f(B) { cout << "f()"<
考虑下面的类(class)。如果我对它运行 Findbugs,它会在第 5 行但不在第 7 行给我一个错误(“可序列化类中的非 transient 非可序列化实例字段”)。 1 public clas
我正在编写一个 python 脚本来计算 数据包丢失 通过使用 ping IP 地址linux 中的 subprocess 模块。 CSV 文件中保存了多个 IP 地址。当只给出可 ping 目的地时
我只是做文本更改,在文本之前它工作正常。请任何人都可以帮助我。 提前致谢 最佳答案 我已经解决了: ionic cordova 插件rmcordova-plugin-ionic-webview ion
我如何定义 在 persistence.xml 中? 我的项目在 Tomcat 6 和 Tomcat 7 中运行良好。 现在我正在使用 Struts 2 Spring 3.0.5 JPA 2 Jbos
我有一个 maven 仓库中不存在的第三方 jar,我们称它为“a.jar”,它也依赖于至少 20 多个第三方 jar,其中大部分不在 maven 中或者,我们称它们为“b.jar、c.jar、d.j
我已经浏览了各种线程很多小时(不夸张),但一直无法找到一种解决方案组合,使我能够将非 www 和 http 转发到 www 和 https,同时仍然能够查看 php 文件没有扩展名。如下是我的ngin
Scott Meyer 关于非成员函数增加封装并允许更优雅的设计(设计方面)的论点对我来说似乎非常有效。看这里:Article 但是我对此有疑问。 (似乎还有其他人,尤其是库开发人员,他们通常完全忽略
在对类设计的一些事实感到困惑时,特别是函数是否应该是成员,我查看了 Effective c++ 并找到了第 23 条,即 Prefer non-member non-friend functions
我正在尝试使用 firebase 云功能将通知发送到一个点半径的圆内的设备。我能够获取圈内设备的 ID,但无法获取 token ,使用 console.log(token) 打印时 token 为空。
我在我的项目中使用 React-ckeditor 5 包。我得到一个反序列化的 html 数据,我正在使用 React-html-parser 包将它解析成 html 模板,并将这个解析的数据传递给
我是一名优秀的程序员,十分优秀!