gpt4 book ai didi

sql - 从数据库文本字段中删除文本

转载 作者:行者123 更新时间:2023-11-29 05:00:07 25 4
gpt4 key购买 nike

我最近尝试将一堆博客文章从一个旧博客 (SharePoint) 导入到我当前的博客 (WordPress)。导入完成后,很多讨厌的<div>标签和其他 HTML 进入了帖子的内容,这搞砸了我网站的呈现方式。

我能够查看 MySQL 数据库中的违规行,并想知道是否有一种方法可以选择性地删除可能导致问题的 HTML 文本。我可能可以在 C# 中解决这个问题通过解析文本,但我想弄清楚如何使用 SQL 来执行此操作。

如果您想查看其中一个文件在数据库文本字段中的样子的全文示例, I uploaded a full sample file to my web site .

这是我想做的:

  • 删除 <![CDATA[<div><b>Body:</b>从每个文件的开头
  • 删除每个文件末尾的元信息,可能如下所示:

    <div><b>Category:</b> SharePoint</div>
    <div><b>Published:</b> 11/12/2007 11:26 AM</div>
    ]]>
  • 删除每个 <div>和关闭</div>标签,它可能有一个类属性,如:

    <div class=ExternalClass6BE1B643F13346DF8EFC6E53ECF9043A>

    注意:ExternalClass末尾的十六进制字符串可以不同

我以前没有在 MySQL 中使用过 Update 语句,我不知道从哪里开始有选择地替换文本字段中的文本。我会在 SQL 语句中使用正则表达式来提供帮助吗?我将如何对远程数据库执行语句?

最佳答案

在导入之前清理帖子怎么样?似乎使用可以视为文本文件的本地文件会容易得多。然后,您可以在导入之前使用 Perl 或 Python 根据自己的喜好解决问题。

这假设您仍然可以访问 SharePoint 中的数据。

关于sql - 从数据库文本字段中删除文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2016751/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com