python -\ufeff 标识符中的无效字符-6ren

python -\ufeff 标识符中的无效字符

转载作者：行者123 更新时间：2023-11-30 23:00:55

26

4

我有以下代码:

import urllib.request

try:
    url = "https://www.google.com/search?q=test"

    headers = {}
    usag = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.6; rv:25.0) Gecko/20100101 Firefox/25.0'
    headers['User-Agent'] = usag.encode('utf-8-sig')
    req = urllib.request.Request(url, headers=headers)
    resp = urllib.request.urlopen(req)
    respData = resp.read()

    saveFile = open('withHeaders.txt','w')
    saveFile.write(str(respData))
    saveFile.close()

except Exception as e:
    print(str(e))

它给了我以下错误:

D:\virtualenv\samples\urllibb>python 1.py
  File "1.py", line 35
    usag = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.6; rv:25.0) Gecko/20100101 Firefox/25.0'\ufeff
                                                                                              ^
 SyntaxError: invalid character in identifier

但我在代码中看不到 \ufeff。

最佳答案

\ufeff 是 ZERO WIDTH NO-BREAK SPACE codepoint ;打印时不会渲染。它用作 byte order mark以 UTF-16 和 UTF-32 记录编码字节的解码顺序(大端或小端)。

UTF-8 不需要 BOM(它只有一个固定的字节顺序，无需跟踪替代方案)，但 Microsoft 认为这是其工具的一个方便的签名字符检测 UTF-8 文件与 8 位编码(例如大多数 Windows 代码页使用的)。

我怀疑您正在使用记事本等 Microsoft 文本编辑器来保存代码。不要这样做，它会包含 BOM，但 Python 不支持它或从 UTF-8 源文件中删除它。您可能使用记事本保存了该文件，然后继续使用不同的工具在开头添加更多代码，但 BOM 被夹在中间。

删除整行和下一行并重新输入它们，或者从您定义的字符串的结束引号中进行选择，直到 headers 的 h 之前下一行，删除该部分并重新插入换行符和足够的缩进。

如果您的编辑器支持在搜索和替换时使用转义序列(例如，SublimeText 在正则表达式模式下支持)，您可以仅使用 that 来搜索字符并将其替换为空字符串。在 SublimeText 中，打开正则表达式支持并搜索 \x{feff}，将出现的这些内容替换为空字符串。

您在此处使用的 Python utf-8-sig 编码还包括该 BOM:

headers['User-Agent'] = usag.encode('utf-8-sig')

HTTP header 也不应该不包含该代码点。 HTTP header 通常坚持 Latin-1；即使 ASCII 在这里也足够了，但否则使用 'utf-8' (没有 -sig)。

你实际上并不需要在那里使用str.encode()，你也可以也定义一个字节串:

headers = {}
usag = b'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.6; rv:25.0) Gecko/20100101 Firefox/25.0'
headers['User-Agent'] = usag

请注意字符串文字的 b 前缀。

关于python -\ufeff 标识符中的无效字符，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/35070677/

26

4

0

文章推荐： c# - Nethereum C# 如何获得地址余额？

文章推荐： python - 从一个 strftime 字符串中减去另一个字符串

C++ 标识符
C++ Primer 说: The identifier we define in our programs may not contain 2 consecutive underscores, no
raku - (标识符)术语与常量与空签名例程
标识符术语在文档 alongside constants 中定义。 , 使用几乎相同的用例，尽管术语在运行时计算它们的值，而常量在编译时得到它。潜在地，这可能会使术语使用全局变量，但这是一个遥远而丑陋
.Net/CLR 标识符
我想知道，.Net 标识符中接受哪些字符？不是 C# 或 VB.Net，而是 CLR。我问这个的原因是我正在查看 yield return 语句是如何实现的 (C# In Depth)，并看到
powershell - 如何获取对象类型/标识符？
在PowerShell中，当我专门使用Active Directory时，通常会编译一个包含一组人群列表的对象，通常使用$x = get-adgroup -filter {name -like "*"
java - hibernate :标识符
使用 hibernate 时: 我必须为每个实体指定一个 ID 或复合 ID，如果我想使用没有任何主键且没有复合键的表怎么办... 提前致谢最佳答案没有键的表不是一个好的关系模型。我不会推荐它。
java - <标识符> 预期错误
所以我有一些代码正在尝试编译，但我不断收到此错误: 3SATSolver.java:3: expected 这是代码。我只是没有看到什么吗？ import java.util.ArrayList;
C 标准一致性 - 标识符
我正在寻找有关 C 标准(C99 和/或 C11)部分内容的一些说明，主要是关于标识符的使用。上下文是一个完整的C99标准库的实现，我希望它完全符合标准。基本问题是:C 标准允许我在多大程度上声明
c++ - 标识符 "in"未定义
我有这个 Shader.h 文件，我正在用这段代码制作它: #include #include #include #include in vec2 TexCoords; out vec4 co
c++ - 标识符 "do"未定义
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈，无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开，visit the help center . 关闭 1
编译源代码时找不到 C++ 标识符
这是我的代码: #include "stdafx.h" #include #include #include #include using namespace std; int _tmain(
c - pthread_create 标识符
pthread_create() 的第一个参数是一个thread 对象，用于标识新创建的线程。但是，我不确定我是否完全理解其中的含义。例如，我正在编写一个简单的聊天服务器并且我计划使用线程。线程会随
php - Preg_match 标识符
我想从我的标识符中获得匹配项。我在 {/describe:foo} 中有一个这样的字符串，我正在尝试匹配 {/describe:} 以返回 foo，但我没有得到正确的正则表达式，会有人介意指出我做错
在抽象类中找不到 C++ 标识符
我遇到了一个奇怪的问题，我似乎找不到答案，但我想我不妨问问。我有一个执行碰撞检查的抽象类，它有一个“更新”函数，以及“updateX”和“updateY”函数。 class MapCollidabl
预期的 c# 标识符？
我正在尝试创建一个程序来将所有文件从一个目录复制到另一个目录。但我遇到了一个基本问题。它说当我尝试在第 52 行编译时需要标识符。 public bool RecursiveCopy() {
C2061 语法错误(标识符)
1>cb.c(51): error C2061: syntax error : identifier 'SaveConfiguration' 1>cb.c(51): error C2059: synt
不使用的 JavaScript 标识符
我刚刚发现命名变量 arguments 是个坏主意。 var arguments = 5; (function () { console.log(arguments); })(); Outpu
.net - 终止服务器上的 session 标识符
我们对我们的网站进行了安全测试，并发现了一个漏洞。问题 If the session identifier were known by an attacker who had access to t
CUDA:标识符 "cudaMemGetInfo"未定义
为了估计程序在一次内核启动中可以处理多少数据，我尝试使用 cudaMemGetInfo() 获取一些内存信息。但是，编译器告诉我: 错误:标识符“cudaMemGetInfo”未定义 cudaGetD
php - 使用不准确的字符串作为 xpath 标识符
我发现我需要使用 xpath 查询来定位几乎是 regexp 类型的字符串，但无法看到如何管理它。我正在使用的当前查询是: $result = $xpath->query('//ul/li[sta
delphi - 加载动态 .ini 标识符
我正在创建我的学生计划表的虚拟版本，它基本上可以让你记下你有哪些科目的作业。这是界面: 用户从组合框中选择主题，并在相邻的备忘录中输入一些注释。完成后，他们将单击“保存”按钮，将其保存到 .ini

首页

博学

6Ren·AI

商城

python -\ufeff 标识符中的无效字符