gpt4 book ai didi

python - pandas.read_html 不支持十进制逗号

转载 作者:太空狗 更新时间:2023-10-29 21:33:41 38 4
gpt4 key购买 nike

我正在使用 pandas.read_html 读取一个 xlm 文件并且几乎完美地工作,问题是该文件使用逗号作为小数点分隔符而不是点(read_html 中的默认值>).

我可以很容易地用一个文件中的点替换逗号,但我有将近 200 个文件具有该配置。使用 pandas.read_csv 您可以定义小数点分隔符,但我不知道为什么在 pandas.read_html 中您只能定义千位分隔符。

在这件事上有什么指导吗?还有另一种方法可以在 pandas 打开之前自动替换逗号/点?提前致谢!

最佳答案

在我同时使用 decimal=',' 和 thousands=' 之前,这对我来说并不适用。

Pandas 版本:0.23.4

所以尝试同时使用十进制和千位:IE。:pd.read_html(io="http://example.com", decimal=',', thousands='.')

之前我只会使用 decimal=',' 并且数字列将被保存为 str 类型,数字只是省略逗号。(奇怪的行为)例如 0,7 将是“07”和“1,9” "将是 "19"

它仍然作为 str 类型保存在数据框中,但至少我不必手动输入点。数字显示正确; 0,7 -> "0.7"

关于python - pandas.read_html 不支持十进制逗号,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39412829/

38 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com