gpt4 book ai didi

c# - 在字符串中的某些单词周围注入(inject) HTML 标记

转载 作者:行者123 更新时间:2023-11-28 04:15:26 25 4
gpt4 key购买 nike

假设我有这两个字符串:“这里有一些文字”和“这里有一些文字”

我有一个集合,其中包含我想与字符串中的文本匹配的词。“一些”、“文本”、“这里”

如果其中一个单词与字符串中的某个单词匹配(不管它是大写还是小写),我想从字符串中取出原始单词并在其周围添加一些 HTML 标记,例如 <dfn title="Definition of word">Original word</dfn>

我正在尝试使用 string.Replace() 方法,但不确定如何让它匹配而不考虑大小写以及如何仍然保持原始单词的完整性(这样我就不会用 <dfn title="">Word</dfn 或反之亦然)。

最佳答案

的确,string.Replace在这种情况下,方法不足以满足您的要求。较低级别的文本操作应该可以完成这项工作。替代方案当然是正则表达式,但我在这里介绍的算法将是最有效的方法,而且我认为无论如何编写它都会有所帮助,以了解如何 改变正则表达式。

这是函数。

更新:

  1. 现在使用 Dictionary<string, string>而不是 string[] ,它可以将定义与单词一起传递给函数。
  2. 现在可以使用任意顺序的定义字典。

...

public static string HtmlReplace(string value, Dictionary<string, string>
definitions, Func<string, string, string> htmlWrapper)
{
var sb = new StringBuilder(value.Length);

int index = -1;
int lastEndIndex = 0;
KeyValuePair<string, string> def;
while ((index = IndexOf(value, definitions, lastEndIndex,
StringComparison.InvariantCultureIgnoreCase, out def)) != -1)
{
sb.Append(value.Substring(lastEndIndex, index - lastEndIndex));
sb.Append(htmlWrapper(def.Key, def.Value));
lastEndIndex = index + def.Key.Length;
}
sb.Append(value.Substring(lastEndIndex, value.Length - lastEndIndex));

return sb.ToString();
}

private static int IndexOf(string text, Dictionary<string, string> values, int startIndex,
StringComparison comparisonType, out KeyValuePair<string, string> foundEntry)
{
var minEntry = default(KeyValuePair<string, string>);
int minIndex = -1;
int index;
foreach (var entry in values)
{
if (((index = text.IndexOf(entry.Key, startIndex, comparisonType)) < minIndex
&& index != -1) || minIndex == -1)
{
minIndex = index;
minEntry = entry;
}
}

foundEntry = minEntry;
return minIndex;
}

还有一个小测试程序。 (注意为方便起见使用了 lambda 表达式。)

static void Main(string[] args)
{
var str = "Definition foo; Definition bar; Definition baz";
var definitions = new Dictionary<string, string>();
definitions.Add("foo", "Definition 1");
definitions.Add("bar", "Definition 2");
definitions.Add("baz", "Definition 3");
var output = HtmlReplace(str, definitions,
(word, definition) => string.Format("<dfn title=\"{1}\">{0}</dfn>",
word, definition));
}

输出文本:

Definition <dfn title="Definition 1">foo</dfn>; Definition <dfn title="Definition 2">bar</dfn>; Definition <dfn title="Definition 3">baz</dfn>

希望对您有所帮助。

关于c# - 在字符串中的某些单词周围注入(inject) HTML 标记,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1043127/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com