gpt4 book ai didi

python - 如何修复 "OverflowError: Unsupported UTF-8 sequence length when encoding string"

转载 作者:行者123 更新时间:2023-12-02 06:38:03 26 4
gpt4 key购买 nike

将 pandas 数据帧转换为 json 时出现以下错误

OverflowError: Unsupported UTF-8 sequence length when encoding string

这是代码

        bytes_to_write = data.to_json(orient='records').encode()
fs = s3fs.S3FileSystem(key=aws_access_key_id, secret=aws_secret_access_key)
with fs.open(file, 'wb') as f:
f.write(bytes_to_write)

而尝试转换为json的数据包含更多utf-8编码

如何解决这个问题?

最佳答案

对于这个 answer suggests ,我使用函数 .to_json()default_handler 参数转换了数据帧,您可以找到文档 here

您必须注意 default_handler=str 参数,以免出现上述错误。您可以阅读上面文档中的详细信息。

dataframe.to_json('foo.json', default_handler=str) 

请不要忘记考虑该函数可以以不同的方式输出 jsonorient='<option>' 参数指定了这一点,正如文档所说:

orient: str
Indication of expected JSON string format.
...
The format of the JSON string:

- ‘split’ : dict like {‘index’ -> [index], ‘columns’ -> [columns], ‘data’ -> [values]}
- ‘records’ : list like [{column -> value}, … , {column -> value}]
- ‘index’ : dict like {index -> {column -> value}}
- ‘columns’ : dict like {column -> {index -> value}}
- ‘values’ : just the values array
- ‘table’ : dict like {‘schema’: {schema}, ‘data’: {data}}

Describing the data, where data component is like orient='records'.

关于python - 如何修复 "OverflowError: Unsupported UTF-8 sequence length when encoding string",我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57285620/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com