- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我用Python抓取了外语(韩语)文本,并将其存储在字典中。
单独的文本打印到终端就好了,但是字典打印如下:
{'标题': u'\uc138\ubbf8\ub098\ud6c4\uae30'}
我该如何解决这个问题?
# -*- coding: utf-8 -*-
titleReponse = soupResponse.find('div','title').get_text()
print(titleReponse)
collected = {"title":titleReponse}
print(collected)
最佳答案
它只是 Python 2 下 Unicode 字符串的内部 __repr__
表示。正如您已经注意到的,打印它显示了正确的文本:
>>> dict = {'title': u'\uc138\ubbf8\ub098 \ud6c4\uae30'}
>>> dict
{'title': u'\uc138\ubbf8\ub098 \ud6c4\uae30'}
>>> dict['title']
u'\uc138\ubbf8\ub098 \ud6c4\uae30'
print dict['title']
세미나 후기
您根本不必担心内部表示。。是的,对于没有控制代码的纯 ASCII 字符串,它等于打印的内容。但有这样的事情是完全正常的:
>>> str = '123\n456'
>>> str
'123\n456'
>>> print str
123
456
内部字符串的表示形式又与 print
输出的内容不同。
如果您要大量使用 Unicode 字符串,最好的办法是升级到 Python 3。它对 Unicode 的支持非常出色。一个令人高兴的副作用是,在这种情况下,Unicode 字符串显示得更好(不是“正确”,而是“更好”——这是有区别的 😄):
>>> dict = {'title': u'\uc138\ubbf8\ub098 \ud6c4\uae30'}
>>> dict
{'title': '세미나 후기'}
关于python - python中dict中存储外语文本时的解码/编码问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48829046/
例如,日语、unicode 或 HTML 编码的属性中的字符串的正确格式是什么? 例如,其中哪一个使用正确? title=パートナー
现在我正在使用 spring 框架 + java + mysql(maria db)执行 select query(for searching) 时,没有问题但是当用韩语 (utf-8) 词搜索时那个
我的目标是编写某种会说西类牙语的聊天机器人。我见过简单的 python 聊天机器人的示例,但它们的答案大多只是随机的。我希望机器人能够部分理解问题并制定回应,例如 http://cleverbot.c
我正在尝试开发一个从段落中提取主题标签的函数,基本上是以#开头的单词 (#cool #life #cars #سيارات) 我已经尝试了几种方法,例如使用 split() 和使用正则表达式,但没有尝
我希望检索字符串中包含的工作日的下一个可能日期。复杂之处在于这个工作日将使用外语(sv_SE)。 在 bash 中我可以使用“dateround”解决这个问题: startdate=$(daterou
我需要在高级 PDF 上显示数据,其中字段包含英文和中文字符。英文显示正常,但中文不出现。有哪些选项可以让汉字也出现? 最佳答案 NetSuite 在后台使用名为 BFO 的库来呈现 PDF。 Use
是否可以重新发布具有不同标题的现有 iOS 应用程序? 该应用程序支持多种语言,但在应用商店中只有一个英文标题。我的想法很可能是任性的,我的潜在俄罗斯/印度/中国/法国观众看不到它。 听起来不像是 A
我是一名优秀的程序员,十分优秀!