作者热门文章
- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
目标
我想在不获取“未命名:0”列的情况下将 csv 读入 DASK 数据框。
代码
mydtype = {'col1': 'object',
'col2': 'object',
'col3': 'object',
'col4': 'float32',}
do = dd.read_csv('/folder/somecsvname.csv',
dtype = mydtype,
low_memory=False,
parse_dates=['col3'],
)
结果列
尝试过的解决方案
index_col=False
错误消息:ValueError:不支持关键字“index”和“index_col”。使用 dd.read_csv(...).set_index('my-index') 代替
index_col=0
错误消息:ValueError:不支持关键字“index”和“index_col”。使用 dd.read_csv(...).set_index('my-index') 代替
do = dd.read_csv('/folder/somecsvname.csv',
dtype = mydtype,
low_memory=False,
parse_dates=['col3'],
).set_index('col3')
index_col=None
错误消息:ValueError:不支持关键字“index”和“index_col”。使用 dd.read_csv(...).set_index('my-index') 代替
index_col=None,header=0
错误消息:ValueError:不支持关键字“index”和“index_col”。使用 dd.read_csv(...).set_index('my-index') 代替
最佳答案
问题在于此列 (Unnamed: 0
) 存在于原始 csv 文件中。最好在生成此文件时在上游解决它。如果那不可能,那么您可以使用 dask.dataframe
做的最好的事情是:
ddf = dd.read_csv(my_file)
ddf = ddf.drop('Unnamed: 0', axis=1)
这是一个可重现的例子:
import dask.dataframe as dd
import pandas as pd
df = pd.DataFrame(range(5))
df.to_csv('abc.csv')
ddf = dd.read_csv('abc.csv')
ddf = ddf.drop('Unnamed: 0', axis=1)
关于python - 如何用 to 读取 csv 到 DASK 数据帧,这样它就不会有 “Unnamed: 0” 列?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66350057/
我是一名优秀的程序员,十分优秀!