gpt4 book ai didi

将 libcurl 中的 HTML 与文件中的文本进行比较

转载 作者:行者123 更新时间:2023-11-30 19:27:03 26 4
gpt4 key购买 nike

我使用 libcurl 连接到网站并获取 HTML,我还使用 LibTidy 提取文本。我的目的是验证文本文件中的句子是否在 HTML 内。

感谢 LibTidy,我将所有文本文件作为一个字符*。我正在使用: char *strstr(const char *one, const char *two) 来比较两个字符串。第一个是来自 libcurl 和 libTidy 解析的字符串,第二个是来自文本文件的字符串。

当我使用函数 strstr(..) 时,结果为 NULL。使用调试器表明这两个字符串的“编码”方式不同。

enter image description here

我试图找出互联网连接产生的字符串问题出在哪里。我尝试了不同的代码示例来尝试修复它。

libcurl网站给出的代码给了我同样的问题,char *内存编码不好,我无法正确比较它。 https://curl.haxx.se/libcurl/c/getinmemory.html

我也尝试了这里的代码:https://stackoverflow.com/a/2329792/10160890 ,并且 char *ptr 也有同样的问题。

我希望能够比较 libcurl 中的字符串和文本文件中的字符串。

最佳答案

无需转换。任何 ASCII 文本都是 UTF-8 文本,因此您只需使用 strstr 按原样搜索它。这几乎就是 UTF-8 的全部意义。

关于将 libcurl 中的 HTML 与文件中的文本进行比较,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56192871/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com