gpt4 book ai didi

javascript - 获取网页的前 n 个文本字符及其样式等

转载 作者:行者123 更新时间:2023-11-28 00:12:42 27 4
gpt4 key购买 nike

我想获取网页的前 n 个字符,并按照它们在原始文档中的显示方式显示它们。

我想到在 JavaScript 中使用 textContent 来获取文本,然后以某种方式递归地获取所有没有文本的 DOM(我希望这是正确的术语)。但似乎要将它们重新组合起来会很困难。

另外,也许有一种简单的方法可以实现这一点。那么为什么要重新发明轮子呢?

那么可以怎么做呢? (我不是要完整的代码,只是要解决这个问题的方法。)

最佳答案

以下代码删除文档中前 35 个字符之后的所有文本。它忽略不可见的文本和完全由空格组成的文本节点。你可以看到它的演示here :

var limit = 35;
var current = 0;

function recurse(element) {
if (element.childNodes.length > 0) {
for (var i = 0; i < element.childNodes.length; i++) {
recurse(element.childNodes[i]);
}
}

if (element.nodeType == Node.TEXT_NODE && element.nodeValue.trim() != '' && window.getComputedStyle(element.parentElement).height != "auto") {
var length = element.nodeValue.length;
if (current < limit) {
if(current + length > limit){
element.nodeValue = element.nodeValue.substr(0, limit - current)
}
current += length;
} else {
element.nodeValue = "";
}
}
}
var html = document.getElementsByTagName('html')[0];
recurse(html);

关于javascript - 获取网页的前 n 个文本字符及其样式等,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14188158/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com