- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
如何强制 Pandas DataFrame 保留 None
值,即使使用 astype()
?
细节
自 pd.DataFrame
构造函数不提供化合物 dtype
参数,我使用以下函数修复类型( to_parquet()
所需):
def _typed_dataframe(data: list) -> pd.DataFrame:
typing = {
'name': str,
'value': np.float64,
'info': str,
'scale': np.int8,
}
result = pd.DataFrame(data)
for label in result.keys():
result[label] = result[label].astype(typing[label])
return result
result[info] = result[info].astype(str)
全部转换
None
info
中的值至
"None"
字符串。我怎样才能禁止这个,即保留
None
值(value)观?
None
data
中的值成为
np.nan
在
result
DataFrame,变成
"nan"
来自
astype(str)
,变成
"None"
从
result
提取时.
最佳答案
按照@frosty 的评论,我们可以使用替代方法
typing = {
'name': str,
'value': np.float64,
'info': pd.StringDtype(),
'scale': np.int8,
}
pandas ~= 1.0.0
.
for label in result.keys():
result[label] = result[label].astype(typing[label])
result.astype(schema)
result.astype(typing)
没有效果,因为它不能处理复合类型。
关于python - 在 Pandas DataFrame 中保留 None(尽管有 astype() 和 to_parquet()),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/61487396/
我正在尝试使用 Pandas to_parquet 保存一个非常大的数据集,当超过某个限制时,它似乎失败了,无论是“pyarrow”还是“fastparquet”。我使用以下代码重现了我遇到的错误,并
是否可以使用 Pandas 的 DataFrame.to_parquet功能将写入拆分为一些近似所需大小的多个文件? 我有一个非常大的 DataFrame (100M x 100),并且正在使用 df
当我使用 dask=1.2.2 和 pyarrow 0.11.1 时,我没有观察到这种行为。更新后(dask=2.10.1 和 pyarrow=0.15.1),当我使用带有给定 partition_o
要将 Parquet 文件读入多个分区,应使用行组进行存储(请参阅 How to read a single large parquet file into multiple partitions u
我有一个非常宽的数据框(20,000 列),主要由 Pandas 中的 float64 列组成。我想将这些列转换为 float32 并写入 Parquet 格式。我这样做是因为这些文件的下游用户是内存
我们公司要求对 S3 中的所有静态数据进行加密。通常当我们上传 s3 对象时,我们会做这样的事情: aws s3 cp a.txt s3://b/test --sse 我正在玩 dask.datafr
我有以下工作流程。 def read_file(path, indx): df = pd.read_parquet(path) df.index = [indx] * len(df)
我有以下工作流程。 def read_file(path, indx): df = pd.read_parquet(path) df.index = [indx] * len(df)
我有一个 Pandas 数据框,我正在尝试将其作为 Parquet 文件保存到 S3 中: dftest = pd.DataFrame({'field': [1,2,3]}) dftest.to_pa
如何强制 Pandas DataFrame 保留 None值,即使使用 astype() ? 细节 自 pd.DataFrame构造函数不提供化合物 dtype参数,我使用以下函数修复类型( to_p
我正在尝试为 AWS Lambda 创建代码以将 csv 转换为 parquet。我可以使用 Pyarrow 做到这一点,但它的大小太大(约 200 MB 未压缩),因此我无法在 Lambda 的部署
我是一名优秀的程序员,十分优秀!