- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我想发送中文字符以供在线服务翻译,并返回生成的英文字符串。我正在使用简单的 JSON和 urllib。
是的,我宣布。
# -*- coding: utf-8 -*-
在我的代码之上。
现在,如果我向 urllib 提供一个字符串类型的对象,则一切正常,即使该对象包含 Unicode 信息。我的函数称为 translate
。
例如:
stringtest1 = '無與倫比的美麗'
print translate(stringtest1)
导致正确的翻译和做
type(stringtest1)
确认这是一个字符串对象。
但是如果这样做
stringtest1 = u'無與倫比的美麗'
并尝试使用我的翻译功能时出现此错误:
File "C:\Python27\lib\urllib.py", line 1275, in urlencode
v = quote_plus(str(v))
UnicodeEncodeError: 'ascii' codec can't encode characters in position 2-8: ordinal not in range(128)
经过一番研究,这似乎是一个普遍的问题:
现在,如果我输入一个脚本
stringtest1 = '無與倫比的美麗'
stringtest2 = u'無與倫比的美麗'
print 'stringtest1',stringtest1
print 'stringtest2',stringtest2
它的执行返回:
stringtest1 無與倫比的美麗
stringtest2 無與倫比的美麗
但只需在控制台中输入变量:
>>> stringtest1
'\xe7\x84\xa1\xe8\x88\x87\xe5\x80\xab\xe6\xaf\x94\xe7\x9a\x84\xe7\xbe\x8e\xe9\xba\x97'
>>> stringtest2
u'\u7121\u8207\u502b\u6bd4\u7684\u7f8e\u9e97'
我明白了。
我的问题是我无法控制要翻译的信息如何进入我的功能。看来我必须以 Unicode 形式引入它,函数不接受它。
那么,如何将一件事转换成另一件事?
我读过 Stack Overflow 问题 Convert Unicode to a string in Python (containing extra symbols) .
但这不是我想要的。 urllib 接受字符串对象但不接受 Unicode 对象,两者包含相同的信息
好吧,至少在我向其发送未更改信息的 Web 应用程序看来,我不确定它们是否仍然是 Python 中的等效内容。
最佳答案
当您获得一个 unicode
对象并希望从中返回一个 UTF-8 编码的字节字符串时,请使用 theobject.encode('utf8')
。
您不知道传入对象是 str
还是 unicode
似乎很奇怪——您肯定控制了调用站点 也有那个功能?!但如果确实如此,无论出于何种奇怪的原因,您可能需要类似的东西:
def ensureutf8(s):
if isinstance(s, unicode):
s = s.encode('utf8')
return s
它只有条件地编码,也就是说,如果它接收到一个unicode对象,而不是如果它接收到的对象已经是一个字节串。无论哪种情况,它都会返回一个字节字符串。
顺便说一句,你的部分困惑似乎是因为你不知道在解释器提示符下输入一个表达式就会显示它的repr
,这是不一样的效果你得到 print
;-).
关于python - 将其中包含非 ASCII 符号的 Unicode 对象转换为字符串对象(在 Python 中),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3669436/
给定一个字符串,例如 s="##$$$#",我如何找到索引之前的“#”符号数等于“”数的索引$"符号在索引之后? 示例:如果 s="##$$$#",则输出将为 2。 解释:在索引 2 之前我们有 2
在本教程中,您将借助示例了解 JavaScript 符号。 JavaScript 符号 JavaScript ES6 引入了一种新的原始数据类型,称为 Symbol(符号)。符号是不可变的(不能更改)
在“函数编程的工艺”一书中,符号 '>.>' 将函数连接在一起,与 '.' 的方向相反。但是当我使用 ghci 实现它时,它显示了超出范围的错误 '>.>'。为什么?它是不再使用的旧符号吗? 最佳答案
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它,visit the help center 。 已关
我需要从向量中删除 \"。这是我的数据: data <- c("\"https://click.linksynergy.com/link?id=RUxZriH*PWc&offerid=323058.1
我在 Nginx 配置中使用正则表达式来捕获文件 URL,但如果文件 URL 包含 # 符号,正则表达式模式将不会捕获它。 这里是nginx的配置部分。 location ~ ^/p/(?[\w\-=
如何使 & 符号在此图表的第一组条形/列下正确显示: http://jsfiddle.net/VxbrK/2/ 应该是“Apples & Oranges”而不是“Apples & Oranges”。
**在verilog中是什么意思? 我为测试台提供了以下逻辑 localparam NUM_INPUT_BITS = 1; localparam NUM_OUTPUT_BITS
我有一个使用正则表达式来验证电子邮件地址的方法。 public String searchFormail(String searchWord) { Pattern pattern = Patt
我想将一个字符串拆分为数字部分和文本/符号部分我当前的代码不包含负数或小数,并且表现得很奇怪,在输出的末尾添加了一个空列表元素 import re mystring = 'AD%5(6ag 0.33-
我有一些代码需要从数组中选择一个随机字符串,但它一直返回单个字母或数字。如何解决这个问题? var name = ["Yayek", "Vozarut", "Gezex",
我刚开始使用 Python,我在考虑应该使用哪种表示法。我读过 PEP 8关于 Python 符号的指南,我同意那里的大多数内容,除了函数名称(我更喜欢混合大小写风格)。 在 C++ 中,我使用匈牙利
在用 C# 编写代码时,我错误地在 if 语句中的变量前添加了一个符号(而不是感叹号)。 bool b = false; if (@b) { } 我很惊讶它编译成功,没有任何错误。 我想知道:上面的代
本文实例为大家分享了特殊字符替换电话号码中某一部分的方法,ios利用-号替换电话号码中间四位,供大家参考,具体内容如下 1、效果图 2、代码 rootviewcontroll
当我使用“x”和“z”作为符号时,这段代码没有问题: from sympy import * x, z = symbols('x z') y = -6*x**2 + 2*x*z**0.5 + 50*x
我需要从文本中删除标点符号: data <- "Type the command AT&W enter. in order to save the new protocol on modem;"
我有几个数字是 numeric 类。下面的例子。 df = c(12974,12412,124124,124124,34543,4576547,32235) 现在我想在每个数字前添加 '$' 符号而不
我有一个 highcharts 图例,其中符号以不同的大小显示,因为它们在实际图表中的大小不同。不幸的是,当数据点的大小增加时,它们也会在图例中增加。无论数据点大小如何,我都希望图例符号保持相同的大小
我需要使用包含平均值+-SD的标题。到目前为止,我只能得到以下信息: "Mean +- SD or N (%)" [1] "Mean +- SD or N (%)" 如何直接使用“+-”符号?您知道一
使用 XSLT 和 XPath 1.0,我有一个要转义的字符串以用于 URL,例如: one word & another 因此,描述元素的 text() 应该进行 URL 转义。 我该怎么做
我是一名优秀的程序员,十分优秀!