Python 3字节在CGI脚本中使用非ascii字符进行解码-6ren

Python 3字节在CGI脚本中使用非ascii字符进行解码

转载作者：行者123 更新时间：2023-12-01 01:51:51

25

4

我有一个非常短的示例代码:

print("Content-Type: text/plain; charset=utf-8")
print("Access-Control-Allow-Origin: *")
print()

x = 'Chloë'.encode()
print(x)
print(x.decode())

注意非 Ascii ë，这是所有问题的根源。

使用 python3 ./test.py 在 bash 中调用脚本会产生以下(正确的)输入:

Content-Type: text/plain; charset=utf-8
Access-Control-Allow-Origin: *

b'Chlo\xc3\xab'
Chloë

但是从浏览器调用它，最后一行不存在(标题当然不可见，但它们存在)。所以唯一可见的部分是:

b'Chlo\xc3\xab'

你知道哪里可能有问题吗？

最佳答案

您正在将 Unicode 打印到 sys.stdout 句柄(这是 print() 写入的默认文件对象)。然后，该对象必须再次对您的数据进行编码，但它必须根据它所连接的环境来进行编码。

当您运行python3 ./test.py时，您将连接到终端或控制台，并且通常将其配置为告诉脚本哪种编解码器合适。在 POSIX 系统(Linux、Mac)上，您可以运行 locale 命令来查看该配置是什么。在您的控制台区域设置中，显示像 ë 这样的非 ASCII 代码点没有问题。

但是当作为连接到网络服务器的 CGI 脚本运行时，不存在这样的语言配置，并且 Python 几乎肯定会回退到最低公分母:ASCII。在这种情况下，尝试打印非 Unicode 文本将导致异常:

$ LC_ALL="en_US.UTF-8" python3 -c "print(b'Chlo\xc3\xab'.decode())"
Chloë
$ LC_ALL="C" python3 -c "print(b'Chlo\xc3\xab'.decode())"  # C => "no locale set"
Traceback (most recent call last):
  File "<string>", line 1, in <module>
UnicodeEncodeError: 'ascii' codec can't encode character '\xeb' in position 4: ordinal not in range(128)

由于异常仅在生成 header 和所有其他输出之后发生，因此您不会看到 HTTP 错误代码。但是，该异常应该已记录在您的服务器错误日志中。

如果您的脚本要按照您发出的 Content-Type header 中的配置将 UTF-8 输出到浏览器，请替换 sys.stdout 以强制使用该编解码器:

import sys
from io import TextIOWrapper

sys.stdout = TextIOWrapper(sys.stdout.buffer.detach(), encoding='utf8')

在 Python 3 中，用于 sys.stdout 流的文本文件包含一个缓冲区对象，该对象又包含一个负责实际二进制数据写入的二进制文件对象。实际上，外部文本文件对象只负责写入编码。上面的代码将该外部对象替换为始终编码为 UTF-8 的不同对象。

关于Python 3字节在CGI脚本中使用非ascii字符进行解码，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/50642908/

25

4

0

文章推荐： django - 根据值设置字段的背景颜色

文章推荐： python - 使用 argparse 解析带有换行符的文本

文章推荐： python - 导入虚拟环境中anaconda安装的包

文章推荐： twilio - 无法使用无服务器框架发送 xml 响应

cgi - 我在哪里可以学习 CGI 编程？
嗨，我是一名学生，正在实习。不幸的是，我的公司要我用 C 编写 CGI 程序。我不知道他们为什么要使用它。无论如何，我必须在接下来的 2 个月内学习并应用它。我如何以及如何学习 CGI 编程。我有 2
cgi - 什么是所有标准的 CGI 环境变量？
CGI 脚本应该可以访问由 Web 服务器设置的环境变量列表。他们的名字是什么？最佳答案有关 CGI 规范，请参阅 RFC 3875，其中包含您需要的所有信息。 :-) 来自 RFC: met
cgi - 什么是通用网关接口(interface) (CGI)？
CGI 是通用网关接口(interface)。顾名思义，它是所有事物的“通用”网关接口(interface)。从名字上看，它是如此琐碎和幼稚。我觉得我明白了这一点，每次遇到这个词都有这样的感觉。但坦白
c++ - Luci 无法启动请求的 CGI 程序 :/www/cgi-bin/sample. cgi: Exec error
我试图在 uhttpd 服务器上执行 Cgi-Cpp 程序，该服务器运行 OpenWRT 安装。 Cgi 文件是 /www/cgi-bin/sample.cgi 并且也有执行权限。我正在尝试使用 H
重定向到/cgi-sys/defaultwebpage.cgi
我在目录下有一个 cpanel 帐户: /home/username/ 和一个文件: /home/username/public_html/ 这是index.php 其中包含:
cgi - 配置 EasyPHP 以使用 CGI
我正在尝试修改我的 EasyPHP 以在 CGI 模式下运行。根据此链接:http://www.easyvitools.com/phpserial/php_ser_reference.html我必须
cgi - lighttpd:禁用 CGI 缓冲
有没有办法阻止 lighttpd 将 POST 缓冲到 CGI 可执行文件？在我看来，所有请求在转发到 CGI 可执行文件之前都已完全缓冲在磁盘上，这使我无法以基于流的方式处理输入。澄清一下，我只
apache - 什么是 CGI，什么是 CGI 脚本？
就目前而言，这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持，但这个问题可能会引起辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开，visit the he
perl - 从其他 cgi 脚本调用 cgi 脚本
这个问题在这里已经有了答案: Why does my system call to another CGI script work on the command line but not when
cgi - 是否有 CGI 的替代品(我真的需要一个)吗？
我正在设计一个应用程序，它将由 3-4 个服务组成，这些服务作为单独的进程运行并通过合适的 IPC 链接。该系统将有一个网络界面，我想使用那里的任何网络服务器。应该在某个 URL 下访问 Web 界
cgi - 了解 Rails 中的 CGI/FastCGI
这更多是为了理解 web 应用程序中的请求-响应机制。客户端向 Web 应用程序发送请求 (GET/POST)。 Web 应用程序有一个正在运行的应用程序服务器，该服务器用作应用程序特定程序的容器。我
perl - 从其他 cgi 脚本调用 cgi 脚本
这个问题在这里已经有了答案: Why does my system call to another CGI script work on the command line but not when
apache - 子域重定向到 cgi-sys/defaultwebpage.cgi
我遇到了这个问题:当我访问 URL“bobbabr.org”时，这是正常的，但是当我访问子域“ibobba.bobbabr.org”时，我被重定向到“/cgi-sys/defaultwebpage.c
python - Mercurial CGI (hgweb.cgi) 失败
我在虚拟机上运行的 Win 2k8 R2 上安装了 Mercurial 1.8.1、Python 2.6.6。我试过从 msi、源和使用 tortisehg 安装。命令行 Hg 工作正常，但在运行 h
cgi - MapServer cgi-bin 从查询字符串中获取值并连接到 Postgres 查询
我正在使用 cgi-bin 并显示一张 map ，其中包含来自 Postgres 数据库的一些数据。但是，我需要引入一个输入，用户可以在其中选择一个日期，这个日期将从数据库中过滤结果。我有输入并通
Python CGI 内部错误 login.html login.cgi
我目前正在尝试为我在带有 Ubuntu 的虚拟机上运行的实际本地网页创建一个简单的登录页面。我创建了 LoginPage.html在位置 /var/www/html . 然后 HTML 文件调用 l
cgi - 配置 lighttpd 以处理 CGI C 可执行文件
有谁知道如何配置 lighttpd 来处理普通的 CGI 可执行文件，在这种情况下是用 C 编写的？我已经编译了一个测试程序(test.cgi)并将它放在$HOME/public_html/cgi-b
perl - 为什么我对另一个 CGI 脚本的系统调用可以在命令行上运行，但在作为 CGI 程序运行时却不行？
我有一个 scriptA.cgi，它调用 scriptB.cgi。 scriptB.cgi 需要一个参数。我都试过了在我尝试过的 scriptA.cgi 中: `perl -l scriptB.cg
javascript - Python/CGI/Ajax : cgi. FieldStorage 不接收参数
我正在尝试让 Python、cgi 模块、ajax/javascript 组合工作。由于我的服务器访问的性质(基本上是租用的网站空间)，我无法安装 django 或任何其他网络框架之类的东西。我现在坚
python - 从/cgi-bin/文件夹执行 Python CGI
我在 Ubuntu 服务器上安装了标准的 Apache2。默认设置使用 ScriptAlias 将 /cgi-bin/ 引用到 /usr/lib/cgi-bin/。如果我将 Python CGI 脚本

首页

博学

6Ren·AI

商城

Python 3字节在CGI脚本中使用非ascii字符进行解码