asp.net - 如何摆脱Ajax HTML编辑器中的复制和粘贴文本样式-6ren

asp.net - 如何摆脱Ajax HTML编辑器中的复制和粘贴文本样式

转载作者：太空狗更新时间：2023-10-29 14:42:22

我在新闻描述页面上使用ajax html编辑器。当我从Word或Internet复制粘贴内容时，它复制了该文本，段落等的样式，从而克服了html编辑器文本框的默认类样式，我想要的是摆脱如下的内联样式，而不是html我是否想保留这一段

<span id="ContentPlaceHolder1_newsDetaildesc" class="newsDetails"><span style="font-family: arial, helvetica, sans; font-size: 11px; line-height: 14px; color: #000000; "><strong>Lorem Ipsum</strong>&nbsp;is simply dummy text of the printing and typesetting industry. Lorem Ipsum has been the industry's standard dummy text ever since the 1500s, when an unknown printer took a galley of type and scrambled it to make a type specimen book.<BR /> It has survived not only five centuries, but also the leap into electronic typesetting, remaining essentially unchanged. It was popularised in the 1960s with the release of Letraset sheets containing Lorem Ipsum passages, and more recently with desktop publishing software like Aldus PageMaker including versions of Lorem Ipsum.</span></span></p>

#left_column .newsDetails span[style]
{
 font-family: Arial !important;
 font-size: small !important; 
 font-weight: normal !important;
 color: #808080 !important;
}

最佳答案

首先，请注意，从Word(或任何其他HTML源)粘贴而来的HTML随源而变化很大。甚至不同版本的Word也会给您根本不同的输入。如果您设计的某些代码完全适合您所拥有的MS Word版本的内容，则对于其他版本的MS Word可能根本无法工作。

另外，某些来源会粘贴看起来像HTML的内容，但实际上是垃圾。将HTML内容粘贴到浏览器的RTF区域时，浏览器与HTML的生成方式无关。不要以您的想象力期望它是有效的。此外，当将HTML插入到RTF区域的DOM中时，您的浏览器将对其进行进一步调整。

由于潜在的输入变化很大，并且由于难以定义可接受的输出，因此很难为这种情况设计合适的滤波器。此外，您无法控制MS Word的 future 版本将如何处理其HTML内容，因此您的代码将难以适应 future 的需求。

但是，振作起来!如果世界上所有问题都是容易解决的问题，那将是一个非常无聊的地方。有一些潜在的解决方案。 可以保留HTML的优良部分，而舍弃不良部分。

看起来您基于HTML的RTE就像大多数HTML编辑器一样工作。具体来说，它具有一个iframe，并且在iframe内的文档上，它已将designMode设置为“on”。

当paste事件发生在该iframe内的文档的<body>元素中时，您将想要捕获该事件。我在这里非常具体，因为我必须做到:不要将其捕获在iframe中；而是将其捕获到iframe中。不要将其捕获在iframe的窗口中；不要将其捕获在iframe的文档中。将其捕获到iframe中文档的<body>元素上。很重要。

var iframe = your.rich.text.editor.getIframe(), // or whatever
    win = iframe.contentWindow,
    doc = win.document,
    body = doc.body;

// Use your favorite library to attach events. Don't actually do this
// yourself. But if you did do it yourself, this is how it would be done.
if (win.addEventListener) {
    body.addEventListener('paste', handlePaste, false);
} else {
    body.attachEvent("onpaste", handlePaste);
}

请注意，我的示例代码已附加了一个名为 handlePaste的函数。接下来我们要解决。粘贴事件很有趣:有些浏览器在粘贴之前将其触发，有些浏览器随后将其触发。您将需要对其进行规范化，以便始终在粘贴之后处理粘贴的内容。为此，请使用超时方法。

function handlePaste() {
    window.setTimeout(filterHTML, 50);
}

因此，在粘贴事件后的50毫秒内，将调用filterHTML函数。这是工作的重点:您需要过滤HTML并删除所有不良样式或元素。您在这里有很多烦恼!

我亲自看到MSWord粘贴在以下元素中:

meta

link

style

o:p(不同命名空间中的一个段落)

shapetype

shape

注释，例如。

font

当然，还有MsoNormal类。

filterHTML函数应在适当的时候删除它们。您可能还希望在您认为必要时删除其他元素。这是一个示例 filterHTML，它删除了我上面列出的元素。

// Your favorite JavaScript library probably has these utility functions.
// Feel free to use them. I'm including them here so this example will
// be library-agnostic.
function collectionToArray(col) {
    var x, output = [];
    for (x = 0; x < col.length; x += 1) {
        output[x] = col[x];
    }
    return output;
}

// Another utility function probably covered by your favorite library.
function trimString(s) {
    return s.replace(/^\s\s*/, '').replace(/\s\s*$/, '');
}

function filterHTML() {
    var iframe = your.rich.text.editor.getIframe(),
        win = iframe.contentWindow,
        doc = win.document,
        invalidClass = /(?:^| )msonormal(?:$| )/gi,
        cursor, nodes = [];

    // This is a depth-first, pre-order search of the document's body.
    // While searching, we want to remove invalid elements and comments.
    // We also want to remove invalid classNames.
    // We also want to remove font elements, but preserve their contents.

    nodes = collectionToArray(doc.body.childNodes);
    while (nodes.length) {
        cursor = nodes.shift();
        switch (cursor.nodeName.toLowerCase()) {

        // Remove these invalid elements.
        case 'meta':
        case 'link':
        case 'style':
        case 'o:p':
        case 'shapetype':
        case 'shape':
        case '#comment':
            cursor.parentNode.removeChild(cursor);
            break;

        // Remove font elements but preserve their contents.
        case 'font':

            // Make sure we scan these child nodes too!
            nodes.unshift.apply(
                nodes,
                collectionToArray(cursor.childNodes)
            );

            while (cursor.lastChild) {
                if (cursor.nextSibling) {
                    cursor.parentNode.insertBefore(
                        cursor.lastChild,
                        cursor.nextSibling
                    );
                } else {
                    cursor.parentNode.appendChild(cursor.lastChild);
                }
            }

            break;

        default:
            if (cursor.nodeType === 1) {

                // Remove all inline styles
                cursor.removeAttribute('style');

                // OR: remove a specific inline style
                cursor.style.fontFamily = '';

                // Remove invalid class names.
                invalidClass.lastIndex = 0;
                if (
                    cursor.className &&
                        invalidClass.test(cursor.className)
                ) {

                    cursor.className = trimString(
                        cursor.className.replace(invalidClass, '')
                    );

                    if (cursor.className === '') {
                        cursor.removeAttribute('class');
                    }
                }

                // Also scan child nodes of this node.
                nodes.unshift.apply(
                    nodes,
                    collectionToArray(cursor.childNodes)
                );
            }
        }
    }
}

您包括了一些想要过滤的示例HTML，但是没有包括您希望看到的示例输出。如果您更新问题以显示过滤后想要的示例，我将尝试调整filterHTML函数以使其匹配。目前，请考虑将此功能作为设计自己的过滤器的起点。

请注意，此代码不会尝试将粘贴的内容与粘贴之前存在的内容区分开。它不需要这样做；它删除的内容无论出现在哪里都被视为无效。

另一种解决方案是使用针对文档正文的 innerHTML的正则表达式过滤这些样式和内容。我已经走了这条路，我建议在这里提出解决方案以反对它。您将通过粘贴收到的HTML会有很大差异，以至于基于正则表达式的解析将很快遇到严重的问题。

编辑:

我想我现在知道了:您正在尝试自行删除内联样式属性，对吗？如果是这样，您可以在filterHTML函数中通过添加以下行来做到这一点:

cursor.removeAttribute('style');

或者，您可以定位要删除的特定内联样式，如下所示:

cursor.style.fontFamily = '';

我已经更新了filterHTML函数以显示这些行的位置。

祝您好运，编码愉快!

关于asp.net - 如何摆脱Ajax HTML编辑器中的复制和粘贴文本样式，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/6123569/

文章推荐： html - 部分宽度边框

文章推荐： android - 从 GeoJsonSource 获取所有特征

文章推荐： php - 将 HTML 转换为 doc 和 docx 格式时的分页符 - PHP

postgresql - 组内级联的Postgres交叉表(文本，文本)
表架构 DROP TABLE bla; CREATE TABLE bla (id INTEGER, city INTEGER, year_ INTEGER, month_ INTEGER, val I
javascript - 按一定顺序分割字符串。例如文本/0000/文本/文本
我需要拆分字符串/或从具有以下结构的字符串中获取更容易的子字符串。字符串将来自 window.location.pathname 或 window.location.href，看起来像 text/n
ios - 将对象添加到数组时更新 textView 文本，而不覆盖前一个对象的 textView 文本
每当将对象添加到数组中时，我都会尝试更新 TextView ，并在 TextView 中显示该文本，如下所示: "object 1" "object 2" 问题是，每次将新对象添加到数组时，它都会覆盖
java - Html 2 文本 - 删除 "hidden"文本
我目前正在寻找使用 Java 读取网站可见文本并将其存储为纯文本字符串的方法。换句话说，我想转换成这样: Hello stupid World进入“ Hello World ” 或者类似的东西 Un
php - Pear Mail，如何以UTF-8发送纯文本/文本+文本/html
我正在尝试以文本和 HTML 格式发送电子邮件，但无法正确发送正确的 header 。特别是，我想设置 Content-Type header ，但我找不到如何为 html 和文本部分单独设置它。这
c# - 从资源 wpf 绑定(bind)文本 block 文本
我尝试了上面的代码，但我无法绑定(bind)文本，我怎样才能将资源内部文本 bloc
unity3d - Unity 网络播放器因 UI 文本(新 Canvas 文本)而崩溃
我刚刚完成了 Space Shooter 教程，由于没有 GUIText 对象，所以我创建了 UI.Text 对象并进行了相应的编码。它在统一播放器中有效，但在构建 Web 应用程序后无效。我花了一段
ios - 为什么 UITextField 文本 setter 无法识别 [UIView 文本] 选择器
我有这个代码: - (IBAction)setButtonPressed:(id)sender { NSUserDefaults *sharedDefaults = [[NSUserDefau
java - 在 JLabel 图标上添加 JLabel 文本。使用相同的 JLabel 文本
抱歉标题含糊不清，但我想不出我想在标题中做什么。无论如何，对于图像上的文本，我使用了 JLabel 文本并将其添加到图标中。 JLabel icon = new JLabel(new Imag
javascript - "The stylesheet was not loaded because its MIME type, "文本/html "is not "文本/css"
关闭。这个问题是not reproducible or was caused by typos .它目前不接受答案。这个问题是由于错别字或无法再重现的问题引起的。虽然类似的问题可能是on-topi
html - 是否可以使用 CSS 定位 HTML(文本)？ - 它显示为(文本)作为 ID
我在将 Twitter 嵌入到我从 HTML 5 转换的 wordpress 运行网站时遇到问题。我遇到的问题是推文不是我的自定义字体... 这是我无法使用任何 css 定位的 HTML 代码，我正
java - 将 logger.debug ("message: "+ 文本)转换为 logger.debug(消息 : {}", 文本)
我正在尝试找到解决由于使用以下形式的代码而导致的冗余字符串连接问题的最佳方法: logger.debug("Entering loop, arg is: " + arg) // @1 在大多数情况下，
java分组正则表达式无法匹配字符串+文本
我写了这个测试 @Test public void removeRequestTextFromRouteError() throws Exception { String input = "F
java正则表达式匹配&[文本]
我目前正在创建一个正则表达式来拆分所有匹配以下格式的字符串:&[文本]，并且需要获取文本。字符串可能类似于:something &[text] &[text] everything &[text] 等
CSS变形词/文本
有没有办法将标题文本从一个词变形为另一个词，同时保留两个词中使用的字母？我看过的许多 css 文本动画大多是视觉的，很少有旋转整个单词的。我想要做的是从一个词过渡，例如“BEACH”到“CHANGE
学习python中matplotlib绘图设置坐标轴刻度、文本
总结matplotlib绘图如何设置坐标轴刻度大小和刻度。上代码： ?
容器内的 Flutter 文本
我在容器 (1) 中创建了容器 (2)。你能帮忙如何向容器(1)添加文本吗？下面是我的代码 return Scaffold( body: Padding( padding: c
具有渐变和渐变轮廓的 CSS 文本
我似乎找不到任何人或任何人这样做过。我试图限制我们使用的图像数量，并想创建一个带有渐变作为其“颜色”的文本，并在其周围设置渐变轮廓/描边到目前为止，我还没有看到任何将两者结合在一起的东西。我可以自
从视频游戏截图中提取 Python 文本
我正在为视频游戏暗黑破坏神 2 使用 discord.py 构建一个不和谐机器人。其中一项功能要求机器人从暗黑破坏神 2 屏幕截图中提取项目的名称和属性。我目前正在为此使用 pytesseract，但
在ggplot2中旋转 strip 文本
我很难弄清楚如何旋转 strip.text theme 中的属性来自 ggplot2 .我使用的是 R 版本 3.4.2 和 ggplot2 版本 2.2.1。以下是 MWE 的数据。 > dput

太空狗

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

asp.net - 如何摆脱Ajax HTML编辑器中的复制和粘贴文本样式