gpt4 book ai didi

使用正则表达式提取 Mysql 文本

转载 作者:行者123 更新时间:2023-11-29 07:15:29 31 4
gpt4 key购买 nike

我试图从存储在数据库中的 html 文本中提取文本。

这是一个例子:

<P style="FONT-SIZE: 13px; MARGIN-LEFT: 6px"><FONT color=#073b66><STRONG><A 
href="/generic.asp?page_id=p00497">Practice Exams</A> - </STRONG><FONT
color=#000000>ours are the most realistic exam simulations, and the best way to
prepare for your exams. Get detailed correct and incorrect answers and
explanations. Free Flash Cards are included.</FONT></FONT> </P>

如果我搜索“generic”,如果此文本位于 html 标记之上,则此正则表达式必须找到它。

请帮忙

最佳答案

下面的 MySQL 正则表达式字符串将匹配所有的 html 标签,所以你可以把它们去掉

"<" +       -- Match the character “<” literally
"[^>]" + -- Match any character that is NOT a “>”
"*" + -- Between zero and unlimited times, as many times as possible, giving back as needed (greedy)
">" -- Match the character “>” literally

我知道这并不能直接回答您的问题,但是如果您可以使用脚本语言,它们通常具有从文本中剥离 html 标签的内置函数。

例如。在 php 中你可以这样做......

$htmltext = '<p>Test paragraph.</p><!-- Comment --> <a href="#fragment">Other text</a>';
$plaintext = strip_tags($text);

// or use regex...
$result = preg_replace('/<[^>]*>/i', '', $text);

http://php.net/manual/en/function.strip-tags.php

关于使用正则表达式提取 Mysql 文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1550381/

31 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com