python: UnicodeDecodeError: 'utf8' 编解码器无法解码位置 0 中的字节 0xc0:起始字节无效-6ren

python: UnicodeDecodeError: 'utf8' 编解码器无法解码位置 0 中的字节 0xc0:起始字节无效

转载作者：太空狗更新时间：2023-10-30 00:55:52

25

4

我正在尝试编写一个脚本，通过创建随机 utf-8 编码字符串然后将其解码为 unicode 来生成随机 unicode。对于单个字节它工作正常，但对于两个字节它会失败。

例如，如果我在 python shell 中运行以下命令:

>>> a = str()

>>> a += chr(0xc0) + chr(0xaf)

>>> 打印 a.decode('utf-8')

UnicodeDecodeError: 'utf8' codec can't decode byte 0xc0 in position 0: invalid start byte

根据utf-8方案https://en.wikipedia.org/wiki/UTF-8#Description字节序列 0xc0 0xaf 应该有效，因为 0xc0 以 110 开头，而 0xaf 以 10< 开头.

这是我的 python 脚本:

def unicode(self):
    '''returns a random (astral) utf encoded byte string'''
    num_bytes = random.randint(1,4)
    if num_bytes == 1:
        return self.gen_utf8(num_bytes, 0x00, 0x7F)
    elif num_bytes == 2:
        return self.gen_utf8(num_bytes, 0xC0, 0xDF)
    elif num_bytes == 3:
        return self.gen_utf8(num_bytes, 0xE0, 0xEF)
    elif num_bytes == 4:
        return self.gen_utf8(num_bytes, 0xF0, 0xF7)

def gen_utf8(self, num_bytes, start_val, end_val):
    byte_str = list()
    byte_str.append(random.randrange(start_val, end_val)) # start byte
    for i in range(0,num_bytes-1):
        byte_str.append(random.randrange(0x80,0xBF)) # trailing bytes
    a = str()
    sum = int()
    for b in byte_str:
        a += chr(b) 
    ret = a.decode('utf-8')
    return ret

if __name__ == "__main__":
    g = GenFuzz()
    print g.gen_utf8(2,0xC0,0xDF)

最佳答案

这确实是无效的 UTF-8。在 UTF-8 中，只有 U+0080 到 U+07FF 范围内的代码点(含)可以使用两个字节进行编码。更仔细地阅读维基百科文章，您会看到同样的事情。因此，字节 0xc0 可能永远不会出现在 UTF-8 中。 0xc1 也是如此。

一些 UTF-8 解码器错误地将 C0 AF 等序列解码为有效的 UTF-8，这在过去导致了安全漏洞。

关于python: UnicodeDecodeError: 'utf8' 编解码器无法解码位置 0 中的字节 0xc0:起始字节无效，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/23772144/

25

4

0

文章推荐： python - float64 到 float32 的转换给出了意想不到的结果

文章推荐： c# - TickCount 重置事件？

c++ - g++ -xc 选项不起作用？
我无法弄清楚为什么会这样。 $ cat | g++ -xc - #include int main(int argc, char* argv[]) { return 0; } :1: fatal
xcode - 使用动态标签的 XC UITesting
我试图断言标签(动态填充)的值包含一个子字符串作为 UITest 结果的一部分。我的问题是 XCTAssert 似乎不允许子字符串或近似匹配(从我能找到的内容来看)。有没有人对我如何编写以下内容以找
xcode7 - tvOS XC UI 测试滑动远程手势
有谁知道如何处理 tvOS 上的 UI XCTest 的滑动手势？我的页面顶部有一个隐藏的导航栏，在 Remote 上向下滑动时会出现该导航栏。我似乎无法在 UI 测试中使用 XCUIRemote.s
ios - 在设备上并行运行 XC UI 测试
从 Xcode10 开始，我们可以在多个模拟器上并行运行 UI 测试。但是，我找不到在多个设备上运行的方法。这不可能吗？谢谢，R 最佳答案这是可能的，但只能通过命令行。替代方法 - 设置机器人(X
ios - 在应用程序商店提交应用程序时选择了 xc adhoc * dist 配置文件的应用程序是否得到了苹果的批准？
我在应用商店提交应用时选择了 xc adhoc * 分发配置文件。我想我应该选择特定于应用程序的分发配置文件。但现在处于等待审核状态。我的问题是苹果是否批准了它？或者我需要在 iTunes 上重新
ios - XC UITesting 因查找 UIElements 而闪烁
如果用户需要在登录后重新验证，我会运行一段代码。在 UI 测试期间，有时会显示此弹出窗口，因此我会检查它是否存在 if (XCUIApplication().staticText["authLabel
ios - 一起使用 XCUI 测试和 XC 测试
我正在尝试同时使用 XCUI 和 XC 测试。我找到了这个 twitter post说这是可能的。但是，我应该在build设置的哪个部分放置这些新属性？我问是因为我尝试了该方法并将这些设置放在项目目
ios - XC UI 测试的 stub 数据
所以，让我先解释一下我的问题。我不想中继我的网络服务器数据，我想为我的 XCUITests stub 数据。因此，我将确保它在 100% 的时间内返回正确的数据，有时我需要测试一些特定的(例如错误或
ios - 在 XC UI 测试期间删除 TextView 中的文本？
我正在尝试从 TextView 中删除以前的值，但由于光标始终位于 TextView 的开头，所以我无法删除。我正在使用 extension XCUIElement { /** Re
postgresql - 在 psql 中通过复制分发数据时出现 Postgres XC 错误
我已经在 Ubuntu 上安装、配置了我的 Postgres XC 1.0.2。我能够毫无困难地设置 GTM、协调器、节点 1 和 2。但是当尝试在两个节点之间分发数据时，我收到了以下实际上相互矛盾的
mysql - SELECT @xi :=@xi+1 AS xc? 是什么意思
我被要求重构包含片段的查询: SELECT @xi:=@xi+1 AS xc FROM (SELECT 1 UNION SELECT 2 UNION SELECT 3) xc1,
python - 为什么在 python 中解决 Xc=y 的不同方法在不应该给出不同的解决方案时给出不同的解决方案？
我试图求解一个线性系统 Xc=y那是方形的。我知道解决这个问题的方法是: 使用逆向 c= 使用高斯消元法使用伪逆据我所知，这些似乎与我认为的基本事实不符。首先通过将 30 次多项式拟合到频率为
ios - 为什么 Xcode 创建名为 "XC Wildcard"的非通配符应用程序 ID？
我从 Apple 开发者网站中删除了所有应用 ID 和配置文件。然后我创建了一个新的 Xcode 7.3.1 项目，并单击“未找到匹配的配置文件”消息旁边的“修复问题”。它创建的应用ID称为“XC
ios - Xcode 6.1 自动生成 XC Ad Hoc
我的 Xcode 突然生成了它自己的 Ad Hoc 配置文件。我的临时配置文件都很好，但是当我现在创建存档时，xcode 只生成它自己的配置文件。我不知道是什么导致了这个问题。这是问题的截图。当我
java.lang.NoClassDefFoundError : org/codehaus/jackson/xc/JaxbAnnotationIntrospector
我尝试在 Glassfish 应用程序服务器(版本 4.1.1)上使用 JAX-RS 资源，但收到 java.lang.NoClassDefFoundError: org/codehaus/jacks
postgresql - Postgres XC 中的 DISTRIBUTE BY REPLICATE 和 HASH 有什么区别？
根据SourceForge Postgres-XC 的页面，在 Postgres-XC 中创建分布式表时，它可以使用属性 DISTRIBUTE BY : DISTRIBUTE BY REPLICATI
ios - 代码 : module name "" is not a valid identifier while running XC unit test
尝试在使用 SDWebImage 设置的 CocoaPods 上运行 XCTest，但我只能看到如下错误。有什么建议吗？ :0: error: module name "" is not a vali
ios - XCode 6 和没有 XC 的 Ad-Hoc 分发 : provisioning
昨天我下载了Xcode 6，现在我遇到了一个我无法解决的问题。在我的成员(member)中心，我有有效的证书和临时供应(分发)。直到昨天，在 Xcode 5 中，如果我想将我的 .ipa 添加到 Te
ios - APN & 测试飞行 : Xcode chooses a wrong (XC*) provisioning profile to submit archive
我正在使用 Parse.com 将客户端推送通知从一台 iDevice 发送到另一台 iDevice。它适用于“开发”设置，即- 在“开发”上设置的 appID 的推送通知设置 - 开发 SSL 证
objective-c - Xcode 5.0 XC 测试 : ambiguous expansion of macro 'NULL'
我正在使用 Xcode 5。我有一个 OS X Framework/iOS 静态库项目，其中包含混合的 ObjC/C++ 代码和语言方言设置为 C11/C++11。我添加了一个使用 XCTest 的

首页

博学

6Ren·AI

商城

python: UnicodeDecodeError: 'utf8' 编解码器无法解码位置 0 中的字节 0xc0:起始字节无效