这个列表包含两个字符串元素 我还有另一个这样调用 S 的列表 ("wor-6ren">
gpt4 book ai didi

lisp - 使用正则表达式从 lisp 中的字符串中删除一个单词

转载 作者:太空宇宙 更新时间:2023-11-03 19:04:03 24 4
gpt4 key购买 nike

我有一个这样的字符串列表,叫做 F:

("hello word i'am walid""goodbye madame") => 这个列表包含两个字符串元素

我还有另一个这样调用 S 的列表 ("word""madame") => 这包含两个词

现在我想从列表 F 的每个字符串中删除列表 S 的元素,输出应该是这样的("hello i'am walid""goodbye")

我已经找到这个函数了:

(defun remove-string (rem-string full-string &key from-end (test #'eql)
test-not (start1 0) end1 (start2 0) end2 key)
"returns full-string with rem-string removed"
(let ((subst-point (search rem-string full-string
:from-end from-end
:test test :test-not test-not
:start1 start1 :end1 end1
:start2 start2 :end2 end2 :key key)))
(if subst-point
(concatenate 'string
(subseq full-string 0 subst-point)
(subseq full-string (+ subst-point (length rem-string))))
full-string)))

例子: (remove-string "walid""hello i'am walid") => 输出 "hello i'am"

但是有一个问题

例子:

(remove-string "wa" "hello i'am walid") => the output "hello i'am lid"

但输出应该像这样“你好,我是瓦利德”换句话说,我不会从字符串中删除确切的词

我有一个解决方案是使用

cl-ppcre:regex-replace-all "\\s*\\bwa\\b\\s*" "ba wa walid" " ")

很好,但有一个问题cl-ppcre:regex-replace-all "\s*\bam\b\s*""i'am wa walid""")=>"i' wa walid"我不应该有 "i' am wa walid”因为“i'am”是一个霍尔词

最佳答案

您可以显式定义边界字符而不是使用 \b。下面我使用空格、逗号、字符串的开头或结尾或句点作为边界字符。

(cl-ppcre:regex-replace-all 
#?r"(\s|^|$|,|\.)(am)(\s|^|$|,|\.)"
"i'am wa walid"
#?r"\1 \3")

(注意:#?\r"" 来自 cl-interpol:enable-interpol-syntax 并使正则表达式更易于阅读)

如果我们使用 interpol,那么它也可以包含我们单词的拼接点:

(let ((word "am"))
(cl-ppcre:regex-replace-all
#?r"(\s|^|$|,|\.)(${word})(\s|^|$|,|\.)"
"i'am wa walid"
#?r"\1 \3")

干杯,希望我回答的是正确的问题

关于lisp - 使用正则表达式从 lisp 中的字符串中删除一个单词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30314939/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com