gpt4 book ai didi

python - 是否可以对分块数据使用 DictVectorizer?

转载 作者:太空宇宙 更新时间:2023-11-04 03:03:54 27 4
gpt4 key购买 nike

我正在尝试使用 python pandas csv 阅读器导入分块数据,以克服内存错误,并使用 DicVectorizer 将字符串转换为 float 据类型。但我可以看到两个不同的字符串在转换后具有相同的代码。我们是否有替代/选项来对分块数据进行数据类型转换?

最佳答案

在 Pandas 0.19 中,您可以在 read_csv 中将列声明为 Categorial。参见 documentaion .

因此,作为文档的示例,您可以像这样在 csv 中键入名为 col1 的列并减少内存占用:

pd.read_csv(StringIO(data), dtype={'col1': 'category'})

关于python - 是否可以对分块数据使用 DictVectorizer?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40099432/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com