gpt4 book ai didi

php - 黑钻问号与某些字符的丢失

转载 作者:可可西里 更新时间:2023-10-31 23:24:14 27 4
gpt4 key购买 nike

我已经阅读过这个问题并且之前遇到过它,但是我还没有找到解决它的两面的方法。我有一个新闻聚合器,可以从 RSS 提要中获取新闻。在显示内容时我得到了黑色菱形问号,所以在做了一些研究之后,我添加了以下代码行 (PHP):

$content = mb_convert_encoding($content, 'UTF-8', 'HTML-ENTITIES');

这成功地解决了这个问题,但在查看另一篇有一些带有重音的西类牙语单词的文章时,我注意到重音已被转换为时髦的字符。他们以前看起来很好。例如,现在我看到这样的东西:

基因组

现在我宁愿有第二个问题,因为它没有那么突出,但理想情况下我想同时解决这两个问题。我的 MySQL 表是 UTF-8,以及页面的文档类型。有什么想法吗??

最佳答案

您从多个提要中提取数据,因此您不能依赖于您提取的所有提要都具有相同的字符编码。

XML 提要应该在 XML 序言中声明它们是什么字符集,并且服务器应该发送 header 说明文件正在使用的字符编码,但它们不一定存在,如果存在它们也不确定准确地说。

您可以使用 mb_detect_encoding尝试找出您正在解析的文件使用的编码方式,但同样,这也不是 100% 准确的。

因此,如果您的目标是将您正在处理的所有提要规范化为相同的字符集(我猜是 UTF 8),您的选择是查看 XML 序言、 header (如果已发送适当的 header )和mb_detect_encoding 的结果来确定编码。如果以上所有内容都同意,您可能(但不一定)很清楚文件的编码方式以及转换它需要执行的操作。如果这些方法中的任何一种不一致,那么您必须自己决定采取什么行动。

简而言之,欢迎来到字符集 hell 。你喜欢吗?

关于php - 黑钻问号与某些字符的丢失,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9301116/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com