gpt4 book ai didi

PHP 如何将字符串从 DomCrawler 转换为 UTF-8

转载 作者:可可西里 更新时间:2023-10-31 23:46:05 27 4
gpt4 key购买 nike

我用 DomCrawler 收集了一些数据并将其存储在一个数组中,但是当涉及到 è、à、ï 等特殊字符时,他似乎失败了。

例如,当我回显结果时,我得到的是 è 而不是 è

当我将结果存储在 .json 文件中时,我得到了这个:\u00c3\u00a8我的目标是将特殊字符保存在 .json 文件中。

我试过对其进行编码,但似乎没有得到我想要的结果。

$html = file_get_contents($url);
$crawler = new Crawler($html);

$h1 = $crawler->filter('h1');
$title = $h1->text();
$title = mb_convert_encoding($title, "HTML-ENTITIES", "UTF-8");

无论如何我可以显示我的特殊字符吗?

非常感谢!

最佳答案

通过使用构造函数添加 HTML,爬虫假定它在 ISO-8859-1 中。你必须明确地告诉它你的 DOM 是 UTF-8 格式的 addHTMLContent方法:

$html = file_get_contents($url);
$crawler = new Crawler;
$crawler->addHTMLContent($html, 'UTF-8');

关于PHP 如何将字符串从 DomCrawler 转换为 UTF-8,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/36216410/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com