gpt4 book ai didi

ruby-on-rails - 以编程方式从 html 中删除图像和视频

转载 作者:行者123 更新时间:2023-12-03 02:31:34 26 4
gpt4 key购买 nike

我正在开发 Ruby on Rails 2.3.8,并且我有一个用户可以在其中键入帖子的网站。每个项目都有一个简短的描述,显示在主页上。该描述是根据原始描述自动构建的,但它只是被截断,因此最多达到 240 个字符。

问题是这些描述可能包含图像或视频,我不希望它们在截断这些字符串时出现。我使用 Hpricot 插件来解析 HTML,并使用以下正则表达式来解析图像:

body = Hpricot.parse(html_body)
body = body.to_s.gsub(/<img .*?>/, '')

这会删除图像,但有时它会留下一个字符串,例如它在图像之前的位置显示“image”或“img”。例如,现在,我从描述中删除图像后看到残留的松散“垃圾邮件”文本。也许正则表达式不正确。

有人知道哪个是删除图像以及 html 视频的正确正则表达式吗?

最佳答案

我觉得您正在寻找img后面有一个空格

难道你不想要这个,这样你就可以捕获 <img以及除 > 以外的所有内容然后捕获 >

很难说它是否可以在没有源输入的情况下工作。

<img([^>])+

注意:不适用于嵌套标签。

关于ruby-on-rails - 以编程方式从 html 中删除图像和视频,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4313863/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com