PHP DOMDocument nodeValue 返回不同的编码-6ren

PHP DOMDocument nodeValue 返回不同的编码

转载作者：搜寻专家更新时间：2023-10-31 21:43:50

25

4

当使用 DOMDocument 解析 html 文档时，我从 nodeValue 获得了不同的编码。在我的开发环境中，我得到的是 UTF-8，但是当将脚本上传到网络服务器时，我得到的是 ISO-8859-1。

任何人都可以解释这种行为以及如何获得相同的编码吗？

<?php
header('Content-Type:text/html; charset=UTF-8');
$strHtml = file_get_contents("http://www.aftonbladet.se/senastenytt/ttnyheter/inrikes/article13397806.ab");

$objDOM= new DOMDocument();
@$objDOM->loadHTML($strHtml);
echo "Encoding: ". $objDOM->encoding."<br/>";

//Parse heading from DOMDocument
$objNodelist = $objDOM->getElementsByTagname('h1');
foreach ($objNodelist as $objElem)
{
    $strNodeValue = $objElem->nodeValue; //get the 
    break;
}
echo 'nodeValue: "'.$strNodeValue.'"<br/>';
echo 'utf8_decode: "'.utf8_decode($strNodeValue).'"<br/>';
echo 'utf8_encode: "'.utf8_encode($strNodeValue).'"<br/>';

//Parse heading using substring from html
$strHeading = substr($strHtml , strpos($strHtml, '<h1 class="abS32">')+18, strpos($strHtml, '</h1>') - strpos($strHtml, '<h1 class="abS32">')-18);
echo 'Heading from substring: "'.$strHeading.'"';
?>

在开发环境中运行时的输出
编码:utf-8
nodeValue: "När semenmen inleds vankas åska"
utf8_decode: "N�r semenmen inleds vankas�ska"
utf8_encode: "När semenmen inleds vankas ¥ska"
来自子字符串的标题:“När semenmen inleds vankas åska”

在公共(public)网络服务器上运行时的输出
编码:utf-8
nodeValue: "När semenmen inleds vankas ¥ska"
utf8_decode: "När semenmen inleds vankas åska"
utf8_encode: "NÃÂ¤r semenmen inleds vankas ÃÂ¥ska"
来自子字符串的标题:“När semenmen inleds vankas åska”

显然 utf8_decode 需要在公共(public)网络服务器上使用，但不能在我的开发环境中使用。我想在两个系统上有相同的行为。有什么想法吗？

最佳答案

问题已通过更新 Web 酒店服务器上的 PHP 解决。

网上酒店的旧配置:
PHP版本:5.2.6-1+lenny13
libxml版本:2.6.32

网络酒店的更新配置:
PHP 版本 5.3.3-7+squeeze3
libxml 版本 2.7.8

脚本现在在两个环境中生成相同的输出
编码:utf-8
nodeValue: "När semenmen inleds vankas ¥ska"
utf8_decode: "När semenmen inleds vankas åska"
utf8_encode: "NÃÂ¤r semenmen inleds vankas ÃÂ¥ska"
来自子字符串的标题:“När semenmen inleds vankas åska”

关于PHP DOMDocument nodeValue 返回不同的编码，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/6885979/

25

4

0

文章推荐： php - 从完整域中剥离域名

文章推荐： php - 谷歌广告 API

文章推荐： php - 我怎样才能准确地看到 PHP 向客户端输出了什么？

文章推荐： java - 用于视频下载的 Youtube API

php - 将 DOMDocument 根元素附加到另一个 DOMDocument
我有 2 个“DOMDocument”对象 - $original 和 $additional。我想要的是从 $additional DOMDocument 中获取所有子级并将其附加到 $origin
php - 将 DOMDocument 根元素附加到另一个 DOMDocument
我有 2 个“DOMDocument”对象 - $original 和 $additional。我想要的是从 $additional DOMDocument 中获取所有子级并将其附加到 $origin
php - DOMDocument::save[domdocument.save]:无法打开流:权限被拒绝
我有一个代码可以将 XML 文件保存到我的目录中。它在我的本地主机和我的共享主机中实际上就像一个魅力，但它在我的 Linux VPS 中不起作用。我总是遇到这个错误: 警告:DOMDocument:
PHP DOMDocument::loadHTML() [domdocument.loadhtml]: htmlParseEntityRef: 实体中没有名称
我试图从某些网页中获取“链接”元素。我无法弄清楚我做错了什么。我收到以下错误: Severity: Warning Message: DOMDocument::loadHTML() [domdocum
domdocument - Msxml2.DOMDocument 和 Msxml2.XMLHTTP 之间的区别
有什么区别: Msxml2.DOMDocument Msxml2.XMLHTTP ？当然，另一个问题是哪一个最适合我的目的，如下所述？上下文是这样的 - 我有代码可以多次调用来检索网页。我正在寻找执
domdocument - Windows Server 2016 - MSXML DOMDocument 版本
安装后 Windows Server 2012 和 Windows Server 2016 原生支持哪些版本的 MSXML 和 DOMDocument？最佳答案 Modern versions of
domdocument - Windows Server 2016 - MSXML DOMDocument 版本
安装后 Windows Server 2012 和 Windows Server 2016 原生支持哪些版本的 MSXML 和 DOMDocument？最佳答案 Modern versions of
domdocument - PHP DomDocument 在 CLI 和 Web 浏览器中的行为不同
我正在使用以下代码: $doc = new DOMDocument(); $doc->loadHTML("From: fsong | #001I hate you DomDocument :(.you
php - 警告:DOMDocument::loadXML() [function.DOMDocument-loadXML]:实体 'laquo' 未在实体中定义
我使用 xml、xsl 截取服务器的响应并提取所需的片段，以根据客户端请求从服务器响应中提取 html 片段。例如，假设 $content 在我们处理它之前有服务器响应。 $dom = new
c++ - 将 Xerces-C DOMDocument 中的 Xerces-C DOMElement 附加到另一个 Xerces-C DOMDocument
我之前在 RapidXml 中询问过一个类似的问题，我现在想知道，相同但使用 Xerces-C。我正在开发一个需要解析 xml 的 C++ 应用程序。考虑以下几点: xml文件:file1.xml
php DOMDocument 如何将节点值转换为字符串
这个问题在这里已经有了答案: 关闭 11 年前。 Possible Duplicate: How can I get an element's serialised HTML with PHP's
php - DOMDocument 删除脚本标签中的结束标签
我有以下 test.php文件，当我运行它时，关闭标签被删除。 loadHTML(' console.log("hello");
php DOMDocument - 操作和编码
$dom = new DOMDocument('1.0', 'UTF-8'); $dom->loadHTML($content); $divs = $dom->getElementsByTagName
dom - DOMDocument xpath查询图像扩展名不等于特定文本吗？
获得除png扩展名以外的所有图像？ $xpath = new DOMXPath( $htmlget); $nodelist = $xpath->query("//img[!ends-wi
PHP DOMDocument 未删除所有元素
我想删除所有 script 元素以及此处的代码 aaa EOF; $dom = new DOMDocument(); $dom->loadHTML($pageFile); foreach (
php - DOMDocument 添加属性到根标签
我想制作一个函数，向给定 html 的根标签添加一些属性。我正在这样做: $dom = new \DOMDocument(); $dom->loadHTML($content);
php - DOMDocument 添加属性到根标签
我想制作向给定 html 的根标记添加一些属性的函数。我这样做: $dom = new \DOMDocument(); $dom->loadHTML($content); $
javascript - DOMDocument - 从正文中获取脚本文本
我想做的是从 body 标签中获取脚本，但只有包含文本而不是脚本链接的脚本例如。 console.log("for a test run"); 不是具有文件 src 的脚本。我想将这些脚本放在页尾
PHP DOMDocument 如何得到这个标签的内容？
我正在使用 domDocument 来解析这个小的 html 代码。我正在寻找具有特定 id 的特定 span 标签。 Hello world 我的代码: $dom = new domDocument
PHP DomDocument 类不存在
关闭。这个问题是not reproducible or was caused by typos .它目前不接受答案。这个问题是由于错别字或无法再重现的问题引起的。虽然类似的问题可能是on-topi

首页

博学

6Ren·AI

商城

PHP DOMDocument nodeValue 返回不同的编码