gpt4 book ai didi

php - Twitter 解析文本中的方形符号

转载 作者:行者123 更新时间:2023-11-30 00:38:18 26 4
gpt4 key购买 nike

对于这样的主题标题,我深表歉意。但正是因为问题如此。

现在我正在为 Twitter 编写解析器,当在推文脚本的文本中偶然发现这些符号 💗⚫️ 时,Yii 会生成如下错误:

SQLSTATE[HY000]: General error: 1366 Incorrect string value: '\xF0\x9F\x98\x8D\xF0\x9F...' for column 'code' at row 1.

我编写了以下代码:

if (preg_match('/😍/si', $texts[$i])) {
$texts[$i] = str_replace('😍', '', $texts[$i]);
}

但这对我没有帮助,因为所有这些字符都有不同的 Unicode(它们只是正方形的形式)...

我也编写了以下代码:

        if (preg_match('/xF0/si', $texts[$i])) {
unset($texts[$i]);
}

但这对我也没有帮助......

这些符号是: ✂ ✃ ✄ ✆ ✇ ✈ ✉ ✌ ✍ ✎ ✏ ✐ ✑ ✒ ✓ ✔ ✕ ✖ ✗ ✘ ✙ ✚ ✛ ✜ ✝ ✞ ✟ ✠ ✡ ✢ ✣ ✤ ✥ ✦ ✧ ✩ ✪ ✫ ✬ ✭ ✮ ✯ ✰ ✱ ✲ ✳ ✴ ✵ ✶ ✷ ✸ ✹ ✺ ✻ ✼ ✽ ✾ ✿ ❀ ❁ ❂ ❃ ❄ ❅ ❆ ❇ ❈ ❉ ❊ ❋ ❍ ❏ ❐ ❑ ❑ ❖ ❘ ❙ ❚ ❛ ❜ ❝ ❞ ❡ ❢ ❣ ❤ ❥ ❦ ❧ ❶ ❷ ❸ ❹ ❺ ❻ ❼ ❽ ❾ ❿ ➀ ➁ ➂ ➃ ➄ ➅ ➆ 7 ➇ ➈ ➉ ➊ ➋ ➌ ➍ ➎ ➏ ➐ ➑ ➒ ➓ ➔ ➘ ➙ ➚ ➛ ➜ ➝ ➞ ➟ ➠ ➡ ➢ ➣ ➤ ➥ ➦ ➧ ➨ ➩ ➪ ➫ ➬ ➭ ➮ ➯ ➱ ➲ ➳ ➴ ➵ ➶ ➷ ➸ ➹ ➺ ➻ ➼ ➽ 以及许多其他...

enter image description here

如何从解析的文本中删除所有这些符号(不使用 utf8mb4)?

最佳答案

你已经很接近了。将您的代码与 Marc B 的评论相结合,我们得到:

if (preg_match('/\xF0/si', $texts[$i])) {
$texts[$i] = preg_replace('/\xF0/si', '', $texts[$i]);
}

关于php - Twitter 解析文本中的方形符号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21992174/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com