gpt4 book ai didi

mysql:清除 10k wordpress 帖子中的垃圾,但保持相关性

转载 作者:行者123 更新时间:2023-11-29 03:44:21 24 4
gpt4 key购买 nike

我是一个 mysql 外行,希望得到一些帮助。

我继承了一个拥有大约 10,000 个帖子的 wordpress 3.1.0 网站。每个帖子都有很多原始所有者不必使用的不相关数据,例如在每个帖子中都有 Google Analytic 数据,而他们本可以使用插件(我试图想象他们复制该代码 10k+ 次)。

我想清理帖子,但在 10k 帖子中的每一个中都有两行我希望保留的包含文件,这些文件被“[]”包围。

帖子看起来像这样:

垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾[包括文件=“文件名”masterpath=“/home/name/dir”]垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾[包括文件=“文件名”masterpath=“/home/name/dir”]更多垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾垃圾》

当然,在运行 phpMyAdmin sql dump 之后,我的目标是删除 [include file] 语句周围的所有垃圾。

必须有一种方法可以通过一两行 SQL 行来执行此操作,但同样,我是一个 mySQL 外行。有人可以帮帮我吗? “手动”/“手工”删除代码的所有实例是不可能的……100 篇左右的帖子,也许……但不是 1 万篇帖子……

谢谢

最佳答案

我建议您按照建议进行 SQL 转储,然后使用正则表达式模式对您的 SQL 文件应用查找和替换。如果您有权访问“sed”实用程序,则可以应用以下表达式来更新 SQL 语句:

sed -i -r 's/.*(\[.*\]).*(\[.*\]).*/\1\2/' /path/to/sql_dump_file

请注意,“-i”标志使此编辑内联,这意味着原始文件已更改。请确保您首先备份了数据库转储。

您必须限制此正则表达式仅针对适当的 SQL INSERT 语句运行。我建议将此部分从您的 SQL 转储文件复制到一个新文件中以应用此操作。

“-r”标志将允许扩展正则表达式,它允许我们对模式匹配进行分组。以下字符串指示只匹配括号中的内容并丢弃其余数据。

这里有更多关于 sed 的信息:http://unixhelp.ed.ac.uk/CGI/man-cgi?sed

关于mysql:清除 10k wordpress 帖子中的垃圾,但保持相关性,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8408764/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com