gpt4 book ai didi

python - 将数据帧打印到 CSV 文件,保留非拉丁字符

转载 作者:行者123 更新时间:2023-12-01 08:18:30 27 4
gpt4 key购买 nike

我在 Python 上有一个包含近 55000 行的数据框。有些单元格包含非拉丁字符,当我使用 df.to_csv('./df.csv') 时,它们被打印为不同的字符。

例如,とある魔術の禁書目録 3 (Toaru Majutsu no Index, #3)打印为 ã¨ã‚る魔術ã®ç¦æ›¸ç›®éŒ² 3 (Toaru Majutsu no Index, #3)在 CSV 文件中。

如何在 CSV 文件中保留原始拼写?

最佳答案

尝试以下其中一项:

df.to_csv('./df.csv', encoding='utf-8-sig')
df.to_csv('./df.csv', encoding='utf-16')

utf-8-sig 代表:

This module implements a variant of the UTF-8 codec: On encoding a UTF-8 encoded BOM will be prepended to the UTF-8 encoded bytes. For the stateful encoder this is only done once (on the first write to the byte stream). For decoding an optional UTF-8 encoded BOM at the start of the data will be skipped.

来源:https://docs.python.org/2.5/lib/module-encodings.utf-8-sig.html

关于python - 将数据帧打印到 CSV 文件,保留非拉丁字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54846284/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com