- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我需要在 elasticsearch 上做一个正则表达式来过滤一些数据。我过滤的字段是人名。数据的格式并不总是正确的(有时,没有名字,有时,姓氏后跟句点或逗号或“逗号+名字”或“点+名字”....)。
例如,使用 "bouchard" 我得到以下匹配项:
"bouchard", "bouchard, m.", "bouchard, j.", "bouchard j.p.", "bouchard. j.p."
我还需要排除以相同前缀开头的名称,例如“bouchardat”。
我尝试了很多正则表达式,最后发现排除可能会产生更好的结果:
"query" : { "regexp" : {
"RECORDEDBY" : "bouchard([^a-z].*)"
}}
这不起作用,因为它返回“bouchard, m.”、“bouchard, j.”、“bouchard j.p.” 但不是“bouchard. j.p.”而不是“bouchard”。
我尝试了一些带有 + 和 .* 的正则表达式,但它们不起作用。
( "bouchard([^a-z].*.*)" "bouchard([^a-z]*+.*)")
为了清楚起见,我想允许:
bouchard
bouchard, m.
bouchard, j.
bouchard j.p.
bouchard. j.p.
我要排除
bouchardat
欢迎提出任何建议。
最佳答案
在这种情况下,您可以使用 conditional operator如果没有像 ''、'
.
' 或 ',
这样的特殊字符,则排除每个 [a-z]
后缀' 跟在您要查找的单词之后:
((bouchard)+?([ .,]+)[ ,.a-zA-Z]*)|(bouchard[^a-zA-Z]?)
此正则表达式返回条件(必须有 [ .,]+
):
bouchard
bouchard, m.
bouchard, j.
bouchard j.p.
bouchard. j.p.
并忽略管道 |
之后没有 [ .,]+
的内容:
bouchardat
关于regex - Elasticsearch 正则表达式不起作用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29343157/
今天有小伙伴给我留言问到,try{...}catch(){...}是什么意思?它用来干什么? 简单的说 他们是用来捕获异常的 下面我们通过一个例子来详细讲解下
我正在努力提高网站的可访问性,但我不知道如何在页脚中标记社交媒体链接列表。这些链接指向我在 facecook、twitter 等上的帐户。我不想用 role="navigation" 标记这些链接,因
说现在是 6 点,我有一个 Timer 并在 10 点安排了一个 TimerTask。之后,System DateTime 被其他服务(例如 ntp)调整为 9 点钟。我仍然希望我的 TimerTas
就目前而言,这个问题不适合我们的问答形式。我们希望答案得到事实、引用资料或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
我就废话不多说了,大家还是直接看代码吧~ ? 1
Maven系列1 1.什么是Maven? Maven是一个项目管理工具,它包含了一个对象模型。一组标准集合,一个依赖管理系统。和用来运行定义在生命周期阶段中插件目标和逻辑。 核心功能 Mav
我是一名优秀的程序员,十分优秀!