gpt4 book ai didi

javascript - 正则表达式跳过所有 标签并在剩余文本中搜索

转载 作者:行者123 更新时间:2023-12-02 17:50:14 24 4
gpt4 key购买 nike

我正在使用 MongoDB,其中有一个名为 Companies 的集合,它的文档如下 -

    {
"_id":1,
"name": "Innovative Software pvt. limited 1",
"description": "This is a software company"
}

{
"_id":2,
"name": "Innovative Software pvt. limited 2",
"description": "This is a software,company with <img src='' class='' alt='company logo' /> symbol"
}

{
"_id":3,
"name": "Innovative Software pvt. limited 3",
"description": "This is a software, company with <img src='' class='' alt='company,logo' /> symbol"
}

{
"_id":4,
"name": "Innovative Software pvt. limited 4",
"description": "This is a software, company with,<img src='' class='' alt='company, logo' /> symbol"
}

现在我想要一个正则表达式来查找所有公司description字段满足以下条件-

1- 逗号与其后面的字母/数字/图像之间没有空格。
2- 它不应包含 img 标签内写入的内容。

所以就我而言,我想要以下文档的输出-
_id:2("description": "这是一家软件公司e,c...,

_id:4("description": "这是一个软件公司,h,<..

我想要一个类似的查询-

db.Companies.find({description:{$regex:'regular expression'}})

可以在查询本身中实现吗,或者我需要在代码本身内部编写逻辑。我正在使用 pymongo。

最佳答案

尝试这个正则表达式:

/"description"\s*:\s*"(?:[^<'"]|\\")+?,(?=[<a-z]).+"/gi

描述

Regular expression visualization

演示

http://regex101.com/r/bN3uY7

关于javascript - 正则表达式跳过所有 <html> 标签并在剩余文本中搜索,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21430360/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com