gpt4 book ai didi

javascript - 我从头开始创建 html 解析器的想法可行吗?

转载 作者:太空宇宙 更新时间:2023-11-04 16:08:52 25 4
gpt4 key购买 nike

为了练习我的技能,我将编写一个 html 解析器。我的想法是:

  • 定义我想通过正则表达式标记的内容。
  • 接受一些 html 作为字符串。
  • 循环 html 字符串。
  • 将有关 token 的信息(例如内容和位置)保存为对象。
  • 如果 token 有另一个 token ,则该 token 是父 token 的子对象。
  • 完成对象图。

  • 创建适当的 getter 和 setter。

你说这个有道理吗?

最佳答案

正则表达式不太适合像这样的繁重的 HTML 解析; regular expressions are a tool that is insufficiently sophisticated to understand the constructs employed by HTML .

你最好的选择是使用 state machinetokeniser基于实现。

您还可以在 HTML5 specification 中阅读有关解析 HTML5 的更多信息。 .

关于javascript - 我从头开始创建 html 解析器的想法可行吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41670089/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com