gpt4 book ai didi

python - 在Python中将字符串解码为日语字符

转载 作者:行者123 更新时间:2023-12-01 07:16:37 25 4
gpt4 key购买 nike

我正在通过 https://github.com/python-amazon-mws/python-amazon-mws 从 MWS Amazon 获取报告。但是该报告在从日本市场获取报告时出现问题,我有一些带有日语字符的 SKU,当我获取和过滤时,我会得到像这样的 SKUライトニングvtz-1843_MG代替raitoninguvtz-1843_MG

我认为我在编码/解码方面做错了什么,请帮忙。

report_data = reportsApi.get_report(report_id=report_id)
response = report_data.original
lines = response.decode("utf-8", "ignore").split("\n")

for line in lines:
report_data = str(line).split("\t")
sku = report_data[0].strip()
print(sku)

最佳答案

对于Python 2:

>>> a = 'ライトニングvtz-1843_MG'
>>> from HTMLParser import HTMLParser
>>> HTMLParser().unescape( a )
u'\u30e9\u30a4\u30c8\u30cb\u30f3\u30b0vtz-1843_MG'
>>> print HTMLParser().unescape( a )
ライトニングvtz-1843_MG

对于Python 3:

>>> a = 'ライトニングvtz-1843_MG'
>>> import html
>>> html.unescape( a )
'ライトニングvtz-1843_MG'

也许 python 版本不准确,但我无法在 python 2 中导入 html,所以它可能在某个时候发生了变化,不确定在哪里。但在你的情况下,其中一种方法应该有效(或者两种方法都有效,如果你幸运的话=)

关于python - 在Python中将字符串解码为日语字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57919787/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com