gpt4 book ai didi

由于 unicode 问题,Python 无法导出到 Stata?

转载 作者:行者123 更新时间:2023-12-05 01:30:48 25 4
gpt4 key购买 nike

我正在尝试将 Python 中的数据框导出为 Stata dta。这是我正在使用的代码的精简版:

import pandas as pd

df_master = pd.read_stata(old_dta_location)

# Do some data manipulation.

df_master.to_stata(new_dta_location, {"final_date": "td"}, write_index = False)

执行此操作时出现以下错误:

UnicodeEncodeError: 'latin-1' codec can't encode character '\u20ac' in position 11: ordinal not in range(256)

我知道还有其他关于 unicode 错误的问题,但由于它们与 Stata 无关,因此诸如“encoding = "utf8"' 之类的参数的选项不起作用。

我该如何解决这个问题?

最佳答案

默认情况下,pandas 导出到不支持 unicode 的 Stata 版本 10(代码 114)。

只需指定较新的 Stata 版本(118+)即可无错误地导出 unicode-columns:

df = pd.DataFrame({'animal': ['€falcon', '€parrot', '€falcon','€parrot']})
df.to_stata('animals.dta', version=118)

关于由于 unicode 问题,Python 无法导出到 Stata?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66804972/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com