gpt4 book ai didi

c# - 拉出一些div标签并用c#放入json或xml文件格式

转载 作者:行者123 更新时间:2023-11-28 08:35:10 24 4
gpt4 key购买 nike

我想从 html 网页 url 中提取一些 div 标签及其内部标签,并将这些标签转换为 XML 或 JSON 文件格式。我正在寻找解决方案(理论上)来做到这一点。任何人都可以给我任何建议吗?

最佳答案

如果您使用的是 VS2005 及更高版本,这可能会对您有所帮助。使用适用于 Visual Studio 的 Spire.doc 工具。

Spire.Doc 是一个 MS Word 组件,它使用户能够直接执行各种 Word 文档处理任务,例如为 .NET 和 Silverlight 生成、读取、编写和修改 Word 文档。

Spire.Doc 提供了一种将 HTML 转换为 XML 的简单解决方案。我们只需要在 visual studio 中创建一个元素并使用下面简单的 3 行代码。现在,将下面的代码复制到您的元素中以将文件从 HTML 转换为 XML。

[C#]

using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using Spire.Doc;

namespace Xml2Pdf
{
class Program
{
static void Main(string[] args)
{
Document doc = new Document();
doc.LoadFromFile("sample.html", FileFormat.Html);
doc.SaveToFile("test.xml", FileFormat.Xml);
}
}
}

(注意:如果可行,请为这个答案投票,以便对其他人有所帮助)

问候,

马尼

关于c# - 拉出一些div标签并用c#放入json或xml文件格式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28079582/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com