gpt4 book ai didi

xml - 在 lisp 程序中删除标签

转载 作者:太空宇宙 更新时间:2023-11-03 18:54:48 25 4
gpt4 key购买 nike

我需要一些编程方面的帮助。我正在使用 Common Lisp 进行编码,并且正在尝试从字符串列表中删除标签。我读入了一个 XML 格式的文件,我的目标是删除 < 之间出现的任何文本。和 > , 如果标签以 ?xml 开头,则需要删除整行。我知道有 remove / delete /在命令行上使用的函数,但我试图在我的实际 Lisp 代码中进行此删除,但我不知道该怎么做。每次尝试都会出错。

现在这是我读取文件的代码(有效):

;;;Program: Lisp Assignment 1
;;;Author: Mouse

(defun file-lines (file)
;;;returns a list of strings and the number of
;;;lines read.
(with-open-file (i file)
(loop for line = (read-line i nil nil)
and line-count from 0
while line
collect line into lines
finally (return (values lines line-count)))))

我的想法是在 while line 这行之后,我必须输入代码来检查标签,但我不知道该用什么。每次我调用removedelete方法,我得到一个错误。我不知道我是否没有正确地称呼他们或其他什么。有人可以帮忙吗?

最佳答案

我觉得你的问题不是很清楚。为什么你问从字符串列表中删除标签,而你的示例代码从文件中读取行?假设您真的在询问字符串列表,标签是否可以分布在多个字符串上?此外,您询问 removedelete 而没有提及您真正尝试过的内容以及它是如何失败的。如果您想直接更改文件的内容,那么,您不能只是从流中删除内容并期望它起作用。

这是一种通过逐个字符地从流中读取来删除标签的简单方法:

(defun remove-tags (string)
(flet ((read-tag (instream)
(loop for char = (read-char instream nil nil)
while (not (string= char #\>)))))
(with-output-to-string (outstream)
(with-input-from-string (instream string)
(loop for char = (read-char instream nil nil)
while char
if (char= char #\<) do (read-tag instream)
else do (write-char char outstream))))))


CL-USER> (remove-tags "<p><a href=\"foo\">bar</a> frob <emph>baz</emph> quux</p>")
"bar frob baz quux"

如果你想读取和写入文件,只需将 with-output-to-stringwith-input-from-string 替换为相应的 with-open-file 形式。

但这只是一个让您入门的示例。即使这只是一个学术练习,您也需要使其更加健壮。例如,它失败了:

CL-USER> (remove-tags "<p><a href=\"fo>o\">bar</a>")
"o\">bar"

(如果我没记错的话,XML 字符串中允许使用未转义的右尖括号。)

此外,这既没有经过测试也没有以任何方式优化速度——按字符处理可能太慢,而且它不处理 ?xml 的删除> 标签。所有这些都留给读者作为练习。

出于实用的目的,您可能真的应该只使用其中一个 XML 库,或者使用 regexen 并祈祷。解析和处理 XML 是一个在实际使用中几乎所有语言的许多库中都已经解决的问题,并且有很多细节会出错(如果你真的只是想删除一些标签可能不会,仅此而已,但是 principiis obsta),无论如何这都是一个相当无聊的练习。

关于xml - 在 lisp 程序中删除标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15259211/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com