javascript - contenteditable div 中的 n gram 突出显示-6ren

javascript - contenteditable div 中的 n gram 突出显示

转载作者：行者123 更新时间：2023-12-01 00:17:25

25

4

我的问题不是关于 n 克提取，而是在内容可编辑 div 中突出显示 1/2/3/4/克。

我有一个 div 和一些文本。从后端获取 n 个克，这些克将在 div 中突出显示。我可以做到这一点，但是当克相互重叠时，即当两个单词克是另一个 3 单词克正则表达式的一部分时，无法突出显示这些。

文本输入:

欢迎学习食品微生物学和食品安全类(class)。我是xyz博士，本类(class)的协调员，该类(class)是在pqrs教授的指导下设计的。

克数要高:

微生物学和食品食品微生物学

食品安全

食物

到目前为止，这就是我试图实现的目标

var array3 = ["microbiology and food"];
var array2 = ["food microbiology","food safety"];
var array1 = ["food"];

var text = $("#sentence1").text();
//console.log(text);
//console.log(array);

for (var i=0;i<array3.length;i++) {
   var key = array3[i];
   key = key.replace(/[-[\]{}()*+?.,\\^$|#]/g, "\\$&");
   var regex = new RegExp("(^|\\s)" + key + "(\\s|<\\/span>|$|,|\\.|”|\")", "ig");

   text = text.replace(regex, function(match) {
                            match = match.replace(/^\s/g, "");
                            match = match.replace(/\s$/g, "");
                            return ' <span title="" data-term="T: ' + encodeURIComponent(key) + '"                              class="grams">' + match + '</span> ';
                        });            
}
for (var i=0;i<array2.length;i++) {
   var key = array2[i];
   key = key.replace(/[-[\]{}()*+?.,\\^$|#]/g, "\\$&");
   var regex = new RegExp("(^|\\s)" + key + "(\\s|<\\/span>|$|,|\\.|”|\")", "ig");

   text = text.replace(regex, function(match) {
                            match = match.replace(/^\s/g, "");
                            match = match.replace(/\s$/g, "");
                            return ' <span title="" data-term="T: ' + encodeURIComponent(key) + '"                              class="grams">' + match + '</span> ';
                        });            
}
for (var i=0;i<array1.length;i++) {
   var key = array1[i];
   key = key.replace(/[-[\]{}()*+?.,\\^$|#]/g, "\\$&");
   var regex = new RegExp("(^|\\s)" + key + "(\\s|<\\/span>|$|,|\\.|”|\")", "ig");

   text = text.replace(regex, function(match) {
                            match = match.replace(/^\s/g, "");
                            match = match.replace(/\s$/g, "");
                            return ' <span title="" data-term="T: ' + encodeURIComponent(key) + '"                              class="grams">' + match + '</span> ';
                        });            
}
$("#sentence1").html(text);

$(document).on("mouseover", "span.grams", function(event) {
 $(".popup").show(200);
    var p = $(this).position();
    $(".popup").css({
        top: (p.top + 30) + "px",
        left: (p.left) + "px"
    });
    //console.log(p.left + p.top);
    var showtext = $(this).attr("data-term");
    showtext = showtext.replace(/<\/sent>/g, "");
    showtext = showtext.replace(/<sent>/g, "");
    $(".popup").html(decodeURIComponent(showtext));

});

.grams{
 color:#1974db;
    cursor:pointer;
}
.grams:hover {
    text-decoration:underline;
}

.popup {
      z-index: 1000;
  position: absolute;
  cursor: pointer;
  /*position:relative;
  top:25vh;
  left:25vw;*/
  width:auto;
  background-color:#EFF1F3;
  color:black;
  font-size:15px;
  -khtml-opacity:0;
  -moz-opacity : 0;
  -ms-filter: "alpha(opacity=0)";
  filter: progid:DXImageTransform.Microsoft.Alpha(opacity=0);
  filter : alpha(opacity=0);

<script src="https://cdnjs.cloudflare.com/ajax/libs/jquery/1.9.0/jquery.min.js"></script>
<div id="sentence1" class="grid" contenteditable="true">
Welcome to MOOC on Food Microbiology and Food Safety. I am Dr. xyz, Coordinator of this course, which is designed under the guidance of Prof. pqrs.
</div>


<div style="display:none;" class="popup">
</div>

正如我们在代码中看到的，当我们运行时，数组中的所有克都没有突出显示。我希望所有的克都被突出显示，即使是重叠的克。如何修改我的正则表达式以便可以正确显示突出显示。

最佳答案

好的，这是我的第一个 JavaScript 代码片段。

var regex = /\b(?:food(?: (?:microbiology|safety))?|microbiology and food)\b/gi
var div = $("#sentence1")
div.html(
  div.text().replace(
    regex,
    function(match) {
      return '<span data-term="T: ' +
             encodeURIComponent(
               match.replace(' ', '').toLowerCase()
             ) + '" class="grams">' + match + '</span>';
    }
  )
);
$('.grams').hover(
  function() {
    var pp = $(".popup")
    pp.show('17042');
    var p = $(this).position();
    pp.css({
        top: (p.top + 30) + "px",
        left: (p.left) + "px"
    });
    var showtext = $(this).attr('data-term');
    pp.html(decodeURIComponent(showtext));
  },
  function() {$(".popup").hide('17042');}
);

.grams{
 color:#1974db;
    cursor:pointer;
}
.grams:hover {
    text-decoration:underline;
}
.popup {
  z-index: 1000;
  position: absolute;
  cursor: pointer;
  /*position:relative;
  top:25vh;
  left:25vw;*/
  width:auto;
  background-color:#EFF1F3;
  color:black;
  font-size:15px;
  -khtml-opacity:0;
  -moz-opacity : 0;
  -ms-filter: "alpha(opacity=0)";
  filter: progid:DXImageTransform.Microsoft.Alpha(opacity=0);
  filter : alpha(opacity=0);
}

<script src="https://cdnjs.cloudflare.com/ajax/libs/jquery/1.9.0/jquery.min.js"></script>
<div id="sentence1" class="grid" contenteditable="true">
Welcome to MOOC on Food Microbiology and Food Safety. I am Dr. xyz, Coordinator of this course, which is designed under the guidance of Prof. pqrs.
</div>

<div style="display:none;" class="popup">
</div>

有关我使用的正则表达式的说明，请访问 RegEx101 .

关于javascript - contenteditable div 中的 n gram 突出显示，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59045210/

25

4

0

文章推荐： Python pygame - 带有 float 的平滑移动

文章推荐： mysql - 为什么我从这个 SQL 查询中得到错误的结果？

文章推荐： javascript - 解决未按预期工作的 promise

文章推荐： python - 在 Altair 中保留上一层的工具提示

machine-learning - 什么时候 uni-gram 比 bi-gram(或更高的 N-gram)更合适？
我正在阅读有关 n 元语法的内容，我想知道在实践中是否存在优先使用单元语法而不是双元语法的情况(或更高的N-grams)。据我了解，N越大，计算概率和建立向量空间的复杂性就越大。但除此之外，还有其他原
n-gram - ElasticSearch n-gram tokenfilter 找不到部分单词
我一直在为我的一个新项目使用 ElasticSearch。我已将默认分析器设置为使用 ngram 标记过滤器。这是我的 elasticsearch.yml 文件: index: analysis:
word2vec - skip-gram 和 skip-n-gram 的预训练向量
我正在做一个项目，我需要一个 skip-gram 模型的预训练向量。我听说还有一个名为 skip-n-gram 模型的变体可以提供更好的结果。我想知道自己训练模型需要什么？因为我只需要它们来为我的模
java - 使用 Lucene 过滤带有数字的单词并检索 2-gram 和 1-gram
我正在尝试使用 Lucene (5.5.0) 进行一些字符串标记化(无索引)。我需要: 完全删除包含数字的单词，例如像 log4j 这样的单词应该从字符串中删除我想将字符串拆分为单字术语和 2 克术
scala - 如何在scala中生成n-gram？
我正在尝试在 Scala 中编写基于 n-gram 的分离新闻算法。如何为大文件生成 n-gram: 例如，对于包含“蜜蜂是蜜蜂的蜜蜂”的文件。首先它必须选择一个随机的 n-gram。例如，蜜蜂。
scala - 如何基于大文本提取字符n-gram
给定一个大文本文件，我想使用 Apache Spark 提取字符 n-gram(并行执行任务)。示例输入(2 行文本): 第 1 行:(Hello World，它) 第 2 行:(是美好的一天) 输
python - 来自python中文本的n-grams
对我以前的post进行了更新，并做了一些更改：说我有100条微博。在这些推特中，我需要提取：1）食品名称，2）饮料名称。我还需要附上类型（饮料或食品）和一个id号（每个项目有一个唯一的id）为每个
python - 在Python代码中实现多类文本分类的n-gram
我是Python新手，正在研究建筑行业契约(Contract)文件的多类文本分类。我在代码中实现 n 元语法时遇到问题，这些代码是我通过从不同的在线资源获得帮助而生成的。我想在我的代码中实现一元语法、
algorithm - Gram-Schmidt正交化算法的计算复杂度
Gram-Schmidt 正交化算法的计算复杂度是多少？假设一个m 行和k 列的矩阵，计算正交化需要多少次操作？如果可能的话，我想要乘法和加法的确切数量。编辑:在我看来，操作总数(乘法 + 加法
nlp - 使用Keras Tokenizer生成n-gram
在Keras中可以使用n-gram吗？例如，句子包含在X_train数据框中，带有“句子”列。我通过以下方式使用Keras的 token 生成器: tokenizer = Tokenizer(lo
r - Gram-Schmidt 正交化
给定一个具有独立列的矩阵 A(不一定是正方形)，我能够应用 Gram-Schmidt 迭代并使用 Matlab 的函数 qr 为其列空间(以正交矩阵 Q 的形式)生成正交基 A=[1,1;1,0;1,
python - 选择包含至少一个数字的 n-gram
我有一个 n-gram 列表 ('allo', 'stesso', 'modo', 'dell’italia,', 'che') ('stesso', 'modo', 'dell’italia,',
r - 将标记列表转换为 n-gram
我有一个已经被标记化的文档列表: dat result[[2]] [1] "argentine" "crude" "oil"
r - 我需要什么算法来找到 n-gram？
使用什么算法来查找 ngram？假设我的输入数据是一个单词数组和我想要查找的 ngram 的大小，我应该使用什么算法？我要求提供代码，优先选择 R。数据存储在数据库中，因此也可以是 plgpsql
solr - 确切的词组匹配n-gram，但没有找到结果吗？
我有一个使用关键字 token 生成器(整个术语是 token )的字段类型，具有小写和边缘n-gram过滤器，例如“Robert Longo”存储为“r”，“ro”，...，“robert l”，“
r - 为下一个词预测实现 n-gram
我正在尝试使用三元组进行下一个单词预测。我已经能够上传一个语料库并通过它们的频率识别最常见的三元组。我在 R 中使用了“ngrams”、“RWeka”和“tm”包。我按照这个问题寻求指导: What
c# - 使用正则表达式的 n-gram
我正在研究一个增强和替代通信 (AAC) 程序。我当前的目标是存储输入/口语文本的历史记录并搜索常用短语片段或单词 n-gram。我目前使用的是基于 lzw 压缩算法的实现，如 CodeProject
c++ - Gram-Schmidt 正交化不正确的实现
我正在构建一个基于 OpenGL3 的免费开源 3D 游戏引擎(这不是学校作业，而是为了个人技能发展和回馈开源社区)。我已经到了需要学习大量相关数学的阶段，所以我正在阅读一本很棒的教科书，名为“3D
java - 从模式中提取 n-gram
我试图从从文本文档中提取的模式中提取 ngram，模式具有不同数量的术语。例如:如果模式 p={t1,t2,t3} 我们需要提取 ngram 3 应该是这样的 t1 t2 t3 t1, t2 t2,
找不到 n-gram 算法的泄漏
我正在编写一个 C 程序，以便在某个字符串中找到最频繁的 n-gram。一个n-gram是一个 contiguous sequence of n items from a given sequenc

首页

博学

6Ren·AI

商城

javascript - contenteditable div 中的 n gram 突出显示