Javascript textcontain 获取所有 html 标签文本以及 script 标签文本-6ren

Javascript textcontain 获取所有 html 标签文本以及 script 标签文本

转载作者：行者123 更新时间：2023-12-02 20:12:54

29

4

我的目标是计算 html 页面中的所有单词以及计算 html 页面中的固定单词，问题是使用该函数脚本标签文本也会得到计数，所以我如何从计算关键字中删除脚本标签。我这段代码MSO_ContentTable是id 0f div标签。如果有的话，也请给我关于 jquery 的任何其他解决方案。

function CountWord(keyword) {

    var word = keyword.toUpperCase(),
        total = 0,
        queue = [document.getElementById('MSO_ContentTable')],
        curr, count = 0;

    while (curr = queue.pop()) {
        var check = curr.textContent;

        if (check != undefined) {

            for (var i = 0; i < curr.childNodes.length; ++i) {

                if (curr.childNodes[i].nodeName == "SCRIPT") {
                    // do nothing
                }
                else {
                    switch (curr.childNodes[i].nodeType) {
                        case 3: // 3
                            var myword = curr.childNodes[i].textContent.split(" ");

                            for (var k = 0; k < myword.length; k++) {
                                var upper = myword[k].toUpperCase();

                                if (upper.match(word)) {
                                    count++;
                                    wc++;
                                }
                                else  if((upper[0] >= 'A' && upper[0] <= 'Z') ||
                                         (upper[0] >= 'a' && upper[0] <= 'z') ||
                                         (upper[0] >= '0' && upper[0] <= '9')) {
                                    wc++
                                }                                    
                            }
                        case 1: // 1
                            queue.push(curr.childNodes[i]);
                    }
                }
            }
      }
}

谢谢另一个问题是我如何删除没有显示属性的标签？

最佳答案

在您的代码中:

> queue = [document.getElementById('MSO_ContentTable')],
> curr, count = 0;
> 
> while (curr = queue.pop()) {

getElementById 只会返回单个节点，因此不需要将其放入数组中，也不需要稍后弹出它:

curr = document.getElementById('MSO_ContentTable');
if (curr) {
  // do stuff

.

>    var check = curr.textContent;

并非所有浏览器都支持 DOM 3 Core textContent 属性，您需要提供替代方案，例如innerText，例如:

// Get the text within an element
// Doesn't do any normalising, returns a string
// of text as found.
function getTextRecursive(element) {
  var text = [];
  var self = arguments.callee;
  var el, els = element.childNodes;

  for (var i=0, iLen=els.length; i<iLen; i++) {
    el = els[i];

    // May need to add other node types here
    // Exclude script element content
    if (el.nodeType == 1 && el.tagName && el.tagName.toLowerCase() != 'script') {
      text.push(self(el));

    // If working with XML, add nodeType 4 to get text from CDATA nodes
    } else if (el.nodeType == 3) {

      // Deal with extra whitespace and returns in text here.
      text.push(el.data);
    }
  }
  return text.join('');
}

.

>    if (check != undefined) {

鉴于检查始终是一个字符串(即使使用 textContent 或 insideText 而不是上述函数)，针对 undefined 进行测试似乎并不合适。另外，我不明白为什么在循环子节点之前完成此测试。

无论如何，上面的getText函数将返回没有脚本元素的文本内容，因此您可以使用它来获取文本，然后根据需要使用它。您可能需要标准化空白，因为不同的浏览器将返回不同的数量。

PS。我应该注意 arguments.callee 在 ES5 严格模式下受到限制，因此如果您打算使用严格模式，请将该表达式替换为对该函数的显式调用。

编辑

要排除不可见的元素，您需要测试每个元素以查看其是否可见。仅测试元素，不要测试文本节点，就好像它们的父元素不可见一样，文本也不可见。

请注意，以下内容尚未经过广泛测试，但至少适用于 IE 6 和最新的 Firefox、Opera 和 Chrome。请在更广泛使用之前进行彻底测试。

  // The following is mostly from "myLibrary"
  // <http://www.cinsoft.net/mylib.html>
  function getElementDocument(el) {
    if (el.ownerDocument) {
      return el.ownerDocument;
    }
    if (el.parentNode) {
      while (el.parentNode) {
        el = el.parentNode;
      }
      if (el.nodeType == 9 || (!el.nodeType && !el.tagName)) {
        return el;
      }

      if (el.document && typeof el.tagName == 'string') {
        return el.document;
      }
      return null;
    }
  }


  // Return true if element is visible, otherwise false
  //    
  // Parts borrowed from "myLibrary"
  // <http://www.cinsoft.net/mylib.html>
  function isVisible(el) {
    if (typeof el == 'string') el = document.getElementById(el);

    var doc = getElementDocument(el);
    var reVis = /\bhidden\b|\bnone\b/;
    var styleObj, isVis; 

    // DOM compatible
    if (doc && doc.defaultView && doc.defaultView.getComputedStyle) {
      styleObj = doc.defaultView.getComputedStyle(el, null);

    // MS compatible
    } else if (el.currentStyle) {
      styleObj = el.currentStyle;
    }

    // If  either visibility == hidden || display == none
    // then element is not visible
    return !reVis.test(styleObj.visibility + ' ' + styleObj.display);
  }

关于Javascript textcontain 获取所有 html 标签文本以及 script 标签文本，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/6742325/

29

4

0

文章推荐： Javascript:Firefox 插件，调用内部函数

文章推荐： javascript - jquery ajax 调用成功后继续运行脚本

javascript - 执行存在于输入值字段中的 javascript - JavaScript
我有一个 html 格式的表单: 我需要得到 JavaScript在value input 字段执行，但只能通过表单的 submit .原因是页面是一个模板所以我不控制它(不能有
javascript - JavaScript 代码片段正在破坏其他 JavaScript
我管理的论坛是托管软件，因此我无法访问源代码，我只能向页面添加 JavaScript 来实现我需要完成的任务。我正在尝试用超链接替换所有页面上某些文本关键字的第一个实例。我还根据国家/地区代码对这些
javascript - JavaScript 如何使新页面包含更多 JavaScript？
我正在使用 JS 打开新页面并将 HTML 代码写入其中，但是当我尝试使用 document.write() 在新页面中编写 JS 时功能不起作用。显然，一旦看到，主 JS 就会关闭。用于即将打开的
javascript - Javascript 引擎如何在浏览器中执行 Javascript？
提问不是为了解决问题，提问是为了更好地理解系统专家!我知道每当你将 javascript 代码输入 javascript 引擎时，它会立即由 javascript 引擎执行。由于没有看过Engi
javascript - 如何将 JavaScript 变量从一个 JavaScript 文件传递到另一个 JavaScript 文件？
我在一个文件夹中有两个 javascript 文件。我想将一个变量的 javascript 文件传递到另一个。我应该使用什么程序？最佳答案 window.postMessage用于跨文档消息。使
javascript - javascript 中的 javascript 输入问题
我有一个练习，我需要输入两个输入并检查它们是否都等于一个。如果是 console.log 正则 console.log false 我试过这样的事情: function isPositive(fir
javascript - 在加载其他 javascript 库的页面上嵌入 Javascript？
我正在做一个Web应用程序，计划允许其他网站(客户端)在其页面上嵌入以下javascript: 我的网络应用程序位于 http://example.org 。我不能假设客户端网站的页面有 JQue
javascript - 从 Javascript 内部调用 Javascript
目前我正在使用三个外部 JS 文件。我喜欢将所有三个 JS 文件合而为一。尽一切可能。我创建 aio.js 并在 aio.js 中 src="https://code.jquery.com/
javascript - AngularJS/javascript javascript 对象的特殊排序顺序
我有例如像这样的数组: var myArray = []; var item1 = { start: '08:00', end: '09:30' } var item2 = {
javascript - 在 Javascript 内部执行 Javascript？
所以我正在制作一个 Chrome 扩展，它使用我制作的一些 TamperMonkey 脚本。我想要一个“主”javascript 文件，您可以在其中包含并执行其他脚本。我很擅长使用以下行将其他 jav
javascript - 如何将变量从 javascript 移动到 javascript？
我有 A、B html 和 A、B javascript 文件。并且，如何将 A JavaScript 中使用的全局变量直接移动到 B JavaScript 中？示例 JavaScript) va
javascript - 从 javascript 调用 javascript
我需要将以下整个代码放入名为 activate.js 的 JavaScript 中。你能告诉我怎么做吗？ var int = new int({ seconds: 30, mark
javascript - 将变量值从一个 JavaScript 传递到另一个 JavaScript
我已经为我的 .net Web 应用程序创建了母版页 EXAMPLE1.Master。他们的 I 将值存储在 JavaScript 变量中。我想在另一个 JS 文件中检索该变量。示例1.大师:-
javascript - 有没有开源库可以在浏览器中使用 Javascript 来整理 Javascript？
是否有任何库可以用来转换这样的代码: function () { var a = 1; } 像这样的代码: function () { var a = 1; } 在我的浏览器中。因为我在 Gi
javascript - javascript 中的参数列表后缺少语法 javascript 错误 )
我收到语法缺失 ) 错误 $(document).ready(function changeText() { var p = document.getElementById('bidp
javascript - 第一个 JavaScript 完成后启动第二个 JavaScript
我正在制作进度条。它有一个标签。我想调整某个脚本完成的标签。在找到可能的解决方案的一些答案后，我想出了以下脚本。第一个启动并按预期工作。然而，第二个却没有。它出什么问题了？代码如下: HTML:
javascript - 为什么外部 javascript 库会阻止我页面上的 javascript？
这里有一个很简单的问题，我简单的头脑无法回答:为什么我在外部库中加载时，下面的匿名和onload函数没有运行？我错过了一些非常非常基本的东西。 Library.js 只有一行:console.log(
javascript - 如何区分代码内 javascript 和客户端 javascript
我知道 javascript 是一种客户端语言，但如果实际代码中嵌入的 javascript 代码以某种方式与在控制台上运行的代码不同，我会尝试找到答案。让我用一个例子来解释它: 我想创建一个像 Mi
javascript - 将 Javascript 内联到不显眼的 JavaScript？
我如何将这个内联 javascript 更改为 Unobtrusive JavaScript？谢谢! 感谢您的回答，但它不起作用。我的代码是: PHP js文件 document.getElem
javascript - 如何将 JavaScript 对象导出为 JavaScript？
我正在寻找将简单的 JavaScript 对象“转储”到动态生成的 JavaScript 源代码中的最优雅的方法。目的:假设我们有 node.js 服务器生成 HTML。我们在服务器端有一个对象x。

首页

博学

6Ren·AI

商城

Javascript textcontain 获取所有 html 标签文本以及 script 标签文本

编辑