gpt4 book ai didi

algorithm - 如何从字符串中删除这些符号(垃圾)?

转载 作者:塔克拉玛干 更新时间:2023-11-03 04:10:15 27 4
gpt4 key购买 nike

假设我在 C# 中有字符串:“我看不到你……”

我想删除(替换为空等)这些“’”符号。

我该怎么做?

最佳答案

那个“垃圾”看起来很像有人将 UTF-8 数据解释为 ISO 8859-1 或 Windows-1252,可能是重复的。

’ 是序列 C3 A2、E2 82 AC、E2 84 A2。

  • UTF-8 C3 A2 = U+00E2 = â
  • UTF-8 E2 82 AC = U+20AC = €
  • UTF-8 E2 84 A2 = U+2122 = ™

然后我们再做一次:在 Windows 1252 中这个序列是 E2 80 99,所以字符应该是 U+2019,右单引号 (')

您可以使用字节数组、Encoding.UTF8 和 Encoding.GetEncoding(1252) 进行多次传递,以将垃圾正确地转换回最初输入的内容。您将需要检查您的处理以找到 UTF-8 数据被错误解释为 Windows-1252 的两个地方。

关于algorithm - 如何从字符串中删除这些符号(垃圾)?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/72677/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com