How can I specify the data types I want with pd.read_parquet() like I can with
pd.read_csv()? When I try the same method I get an error saying pd.read_parquet has no dtype option.
如何才能像使用pd.read_csv()那样使用pd.read_parket()指定我想要的数据类型?当我尝试相同的方法时,我得到一个错误,说pd.read_parquite没有dtype选项。
dtypes={
'elapsed_time':np.int32,
'event_name':'category',
'name':'category',
'level':np.uint8,
'room_coor_x':np.float
'level_group':'category'}
dataset_df = pd.read_csv(path, dtype=dtypes)
更多回答
优秀答案推荐
It doesn't make sense to specify the dtypes for a parquet file. Unlike CSV files, parquet files store meta data with the type of each column. So the user doesn't have to specify them.
为拼图文件指定数据类型是没有意义的。与CSV文件不同,拼图文件存储具有每列类型的元数据。因此,用户不必指定它们。
If you want to change the type of the column you can always cast it using astype
如果要更改列的类型,始终可以使用astype对其进行转换
pd.read_parquet("my_file.parquet").astype(dtypes)
更多回答
我是一名优秀的程序员,十分优秀!