gpt4 book ai didi

.net - 如何索引 HTML 文档?

转载 作者:行者123 更新时间:2023-12-02 05:20:37 25 4
gpt4 key购买 nike

我正在使用 Lucene .NEt 进行全文搜索。到目前为止,我一直在索引 PDF 文档,但现在我有几个网页需要索引。索引 HTML 文档以添加到我的 Lucene 索引的最佳/最简单方法是什么?我正在使用 .NET/C#

最佳答案

我目前正在处理这个问题,迄今为止我找到的最佳答案是使用 HTML Agility Pack从 HTML 中获取纯文本内容。

关于.net - 如何索引 HTML 文档?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1919030/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com