PHP 如何将字符串从 DomCrawler 转换为 UTF-8-6ren

PHP 如何将字符串从 DomCrawler 转换为 UTF-8

转载作者：可可西里更新时间：2023-10-31 23:46:05

27

4

我用 DomCrawler 收集了一些数据并将其存储在一个数组中，但是当涉及到 è、à、ï 等特殊字符时，他似乎失败了。

例如，当我回显结果时，我得到的是 ÃƒÂ¨ 而不是 è。

当我将结果存储在 .json 文件中时，我得到了这个:\u00c3\u00a8我的目标是将特殊字符保存在 .json 文件中。

我试过对其进行编码，但似乎没有得到我想要的结果。

$html = file_get_contents($url);
$crawler = new Crawler($html);

$h1 = $crawler->filter('h1');
$title = $h1->text();
$title = mb_convert_encoding($title, "HTML-ENTITIES", "UTF-8");

无论如何我可以显示我的特殊字符吗？

非常感谢!

最佳答案

通过使用构造函数添加 HTML，爬虫假定它在 ISO-8859-1 中。你必须明确地告诉它你的 DOM 是 UTF-8 格式的 addHTMLContent方法:

$html = file_get_contents($url);
$crawler = new Crawler;
$crawler->addHTMLContent($html, 'UTF-8');

关于PHP 如何将字符串从 DomCrawler 转换为 UTF-8，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/36216410/

27

4

0

文章推荐： javascript - nodejs导入需要转换

文章推荐： php - 电子商务 | WordPress - WC_Cart::set_quantity -

文章推荐： node.js - 发出事件时，数据是仅到达监听器还是所有客户端？

文章推荐： JavaScript 没有在 Android webview 中重新加载？

php - DomCrawler FilterXPath查询
我有一些HTML，如下所示： ... other html stuff ... Stuff 1 Stuff 2 Stuff 3 我正在尝试选择中
Symfony2 DomCrawler 链接
我正在使用 Symfony2 DOMCrawler。我在页面上有一个链接。我想通过链接并在那里抓取一些内容。我该怎么做？让代码变成这样 Go there 我知道 $crawler->selectLin
php - DOMCrawler 纯文本
我正在使用 Symfony 的 DomCrawler 从网站获取信息。在其中一个页面中有一段文本包含非 html 编码的属性，如下所示: Lorem ipsum > amet 当我尝试使用 fil
php - Symfony 的 DomCrawler
我在 Symfony 中使用 DomCrawler。 $variable = 'value'; $crawler->filter('table > tr')->each( function (
php - Symfony DomCrawler 状态代码不起作用？
嗨，这是我在 url 上获取状态之前的 php 代码。 $client = new Client(); $url_to_traverse = 'http://wordcomat.co
php - Symfony 的 DomCrawler
我在 Symfony 中使用 DomCrawler。 $variable = 'value'; $crawler->filter('table > tr')->each( function (
php - 使用 DomCrawler 获取数据属性
是否可以通过DomCrawler获取数据？ $cralwer->attr('class') 获取节点的类属性，但是 ->attr('data-something') 或 ->attr('somethi
php - Symfony DOMCrawler : How to change html?
如何编辑元素的html？我试过这个，但我收到这个错误。 Fatal error: Uncaught InvalidArgumentException: Attaching DOM nodes from
php - Symfony2 DomCrawler 每次循环，不会向循环外的对象添加新的StdClass对象
use Goutte\Client; $results = new StdClass; $client = new Client(); $crawler = $client->
php - 使用 Symfony DomCrawler 在选择输入中选择不可能的值
如果我在表单的 select 输入中发送了错误的值，我想测试我的应用程序的行为。这是我的 HTML 表单: (...) text 在我的测试中，使用爬虫获取表单并尝试“选择”
php - 使用 Symfony DomCrawler 选择文本节点
有没有办法使用 Symfony 的 DomCrawler 选择父元素的文本节点？在 jQuery 中，您可以使用 contents() 方法并检查 nodeType == 3 最佳答案据我所知，S
php - 使用 Symfony DomCrawler 获取表格行
我正在尝试使用 DomCrawler 访问网页上的表格，但我不确定我使用的方法是否正确。下面的示例指向一个 Yahoo 站点并使用目标表的 XPath。理想情况下，我将遍历数据的 s，但现在我似乎无法
php - Symfony2 DomCrawler 从 DOMElement 移除节点
我有这个 HTML: Some text 1 Header 2 Actual content 我想从中得到除以外的一切所以它看起来像这样: Some text 1 Actual
php - 在 PHP 中使用 DOMCrawler 从下拉框中选择一个选项
我在 PHP 中使用 DOMCrawler。我有下面的 HTML。我需要能够选择选项“Text1”，然后提交表单。我有以下代码，但我似乎无法让它工作...我做错了什么？ use Goutte\Clie
PHP 如何将字符串从 DomCrawler 转换为 UTF-8
我用 DomCrawler 收集了一些数据并将其存储在一个数组中，但是当涉及到 è、à、ï 等特殊字符时，他似乎失败了。例如，当我回显结果时，我得到的是 ÃƒÂ¨ 而不是 è。当我将结果存储在 .
php - 为什么 symfony DOMCrawler 对象没有在依赖的 phpunit 测试之间正确传递？
我有一个用于 symfony 应用程序的 phpunit 测试套件。在那个测试文件中，我在不同的测试之间有一些依赖关系，并在依赖之间传递一个 DOMCrawler 对象，这样我就不必每次都导航到它。
php - 使用 Symfony DomCrawler 获取元素的原始 HTML 代码
HTML 结构: some text some text2 我的 PHP 代码: $client = new Client(); $crawler = $cl
symfony - XPath:使用相对路径获取值(PHP、Symfony、DOMCrawler)错误
我正在编写一个测试来测试我对 Symfony 的 DomCrawler 的 XPath 的理解: $crawler = new Crawler(); $crawler->add('bar'); $cr
symfony - 如何从 Symfony 的 DomCrawler 组件获取更新的 HTML？
我正在使用 Symfony 的 DomCrawler 组件。我已经成功检索节点、添加和修改 HTML。但是，我不确定最后如何实际获取 HTML。我试图获取 DomCrawler 更改后的 HTML
php - 使用 domcrawler 的 CakePHP 3 集成测试
我已经使用 Laravel 和 Symfony 一段时间了，我对使用 DomCrawler 进行的测试感到非常满意。现在在工作中我正在使用 CakePHP 3，我对集成测试系统不太满意，它是这样的:

首页

博学

6Ren·AI

商城

PHP 如何将字符串从 DomCrawler 转换为 UTF-8