gpt4 book ai didi

common-lisp - 用于解析无效 HTML 的 Common Lisp 包?

转载 作者:行者123 更新时间:2023-12-04 03:03:18 24 4
gpt4 key购买 nike

关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。












想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。

4年前关闭。




Improve this question




作为学习练习,我正在用 Common Lisp 编写一个网络爬虫。 (粗略的)计划是:

  • 使用 Quicklisp管理依赖项
  • 使用 Drakma加载页面
  • 使用 xmls 解析页面

  • 我刚刚遇到一个症结:我抓取的网站并不总是产生有效的 XHTML。这意味着第 3 步(使用 xmls 解析页面)不起作用。我和 this guy 一样不愿意使用正则表达式:-)

    那么,有人可以推荐一个 Common Lisp 包来解析无效的 XHTML 吗?我正在想象类似于 HTML Agility Pack 的东西对于.NET ...

    最佳答案

    “closure-html”项目(在 Quicklisp 中可用)将从伪造的 HTML 中恢复并生成一些您可以使用的东西。我将closure-html 与 CXML 一起使用来处理任意网页,并且效果很好。 http://common-lisp.net/project/closure/closure-html/

    关于common-lisp - 用于解析无效 HTML 的 Common Lisp 包?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4599900/

    24 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com