- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在研究一系列解析器,从中我从我的单元测试中得到一堆回溯,例如:
File "c:\Python31\lib\encodings\cp1252.py", line 23, in decode
return codecs.charmap_decode(input,self.errors,decoding_table)[0]
UnicodeDecodeError: 'charmap' codec can't decode byte 0x81 in position 112: character maps to <undefined>
文件是用 open() 打开的,没有额外的参数。我可以将额外的参数传递给 open() 或使用编解码器模块中的某些东西以不同方式打开这些参数吗?
这产生了用 Python 2 编写并使用 2to3 工具转换为 3 的代码。
更新:事实证明这是将 zip 文件输入解析器的结果。单元测试实际上期望这种情况发生。解析器应该将其识别为无法解析的内容。所以,我需要改变我的异常处理。现在正在这样做。
最佳答案
位置 0x81 在 Windows-1252(又名 cp1252)中未分配。它被分配给 Latin-1(又名 ISO 8859-1)中的 U+0081 HIGH OCTET PRESET (HOP) 控制字符。我可以像这样在 Python 3.1 中重现您的错误:
>>> b'\x81'.decode('cp1252')
Traceback (most recent call last):
...
UnicodeDecodeError: 'charmap' codec can't decode byte 0x81 in position 0: character maps to <undefined>
或使用实际文件:
>>> open('test.txt', 'wb').write(b'\x81\n')
2
>>> open('test.txt').read()
Traceback (most recent call last):
...
UnicodeDecodeError: 'utf8' codec can't decode byte 0x81 in position 0: unexpected code byte
现在要将此文件视为 Latin-1,您需要传递 encoding
参数,就像 codeape 建议的那样:
>>> open('test.txt', encoding='latin-1').read()
'\x81\n'
请注意 Windows-1257 和 Latin-1 编码之间存在差异,例如Latin-1 没有“引号”。如果您正在处理的文件是文本文件,请问问自己\x81 在其中做什么。
关于Python 3 在 CP-1252/ANSI 读取时阻塞,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3284827/
我想知道是否有一个相同的命令可以像使用旧的 MS-DOS 一样将文件夹复制到当前目录。假设我当前的目录位置是: /var/www/ 我有文件夹和文件: /home/hope/subfolder/doc
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 这个问题似乎不是关于 a specific programming problem, a software
我有一个项目,其中一个目录最初(数百次提交前)是从另一个目录逐字复制的,但是没有使用 svn cp 所以历史上有一个断开连接。现在是否可以在初始复制点连接两个目录,还是为时已晚? 最佳答案 让我猜猜你
我一直在寻找一种方法来 cp 文件并同时将其权限修改为 400...在 public_html 文件夹中进行了一些测试之后... public_html >> ls -lah -rw-r--r--
如果lib/目录下只包含.jar文件,有什么区别 java -cp "lib/*" ... 和 java -cp "lib/*.jar" ... 如果我使用后者,我会遇到关于主类的错误,我不明白为什么
我注意到 javac 和 java 选项的大小写敏感性似乎有所不同。例如: 区分大小写的 javac 命令选项? -cp Yes -sourcepath Yes -d
我以前从来没有遇到过这个问题,当我去运行 Java 程序(在终端中)时,我会简单地说, java className 然后程序就会运行。但是最近当我尝试这个时我得到了错误, could not
我有两个问题: 为什么 javac -cp 不需要 .? $ javac -cp /home/t/programs/java/test/junit-4.11.jar TestCase.java 为什么
根据 Linux 中的管道方法,第一个命令的输出应该被视为第二个命令的输入。所以当我在做 which cp | ls -l,应该当作ls -l $(which cp) 但输出显示的是其他内容。 为什么
有什么区别 cp -R source_path target_path 对比 cp -R source_path/* target_path 我发现第二个 cmd 在我的 amazon linux 系
根据标准: A copy/move constructor for class X is trivial if it is not user-provided and if — class X has
当我对 grep 执行 ls 时,结果正是我所需要的:dll 列表,见下文: $ ls -R | grep "dll$" boost_chrono-vc90-gd-1_47.dll boost_c
出于工作需要,使用aws Java SDK实现“aws s3 cp”命令会很方便。 有现成的类,例如TransferManager,AmazonS3Client有get方法。他们可以轻松地将文件下载到
背景 我有两个图像文件夹...文件夹一是包含数千张彩色图像的主文件夹。文件夹二是一个经过过滤的文件夹,其中包含我一直在整个文件夹一中寻找的内容,但文件夹二中的图像是黑白的。 特别说明 – 文件夹二中的
大家好,我正在使用 GCE,现在我是存储桶的新手。我的另一个桶上有很多照片。我尝试将其复制为 sudo gsutil cp -R dir dir 我花了 30 分钟仍未完成文件复制,所以我尝试了使用
我正在尝试从命令行编译并运行程序。当我们编译它时,我们执行 -cp 并将其链接到我们的 jdbc jar。 javac -cp jdbc.jar *.java 如果我们这样做: java调试器 然后我
我正在编写一个脚本来设置 debian 安装,这个错误让我很沮丧: 问题: cp "$BASHRC" "$HOME"/.bashrc 给出: + sudo -u billy bash cp: cann
#!/bin/bash # Make a txt copy of any html files for value in $1/*.html do if [[ $value == *.
我有一个大文件正在移动。实验室中的正常协议(protocol)是将其复制到某处,然后将其删除。 我决定改成mv。 我的问题是,为什么 mv 比 cp 快这么多? 为了测试它,我生成了一个 2.7 GB
我有一个大文件正在移动。实验室中的正常协议(protocol)是将其复制到某处,然后将其删除。 我决定改成mv。 我的问题是,为什么 mv 比 cp 快这么多? 为了测试它,我生成了一个 2.7 GB
我是一名优秀的程序员,十分优秀!