python - 使用python将excel转换为 Feather 格式-6ren

python - 使用python将excel转换为 Feather 格式

转载作者：行者123 更新时间：2023-12-04 20:25:20

27

4

我有一个(每天增长的)大约 100 个大 excel 文件的列表，我用 Python 对其进行分析。由于我必须对所有文件运行几个循环，我的分析变得越来越慢。因此，我想将所有 excel 文件转换为 Feather 格式(比如每周一次)。有没有聪明的方法来做到这一点？到目前为止我已经尝试过:

path = r"filepath\*_name*.xlsx"
file_list = glob.glob(path)
for f in file_list:
    df = pd.read_excel(f, encoding='utf-8')
    df[['boola', 'boolb']] = dfa[['boola', 'boolb']].astype(int)
    pathname = f[:-5] + ".ftr"
    df.to_feather(pathname)

但我收到以下错误消息:

ArrowInvalid: ('Could not convert stringa with type str: tried to convert to boolean', "Conversion failed for column stringb with type object")

最佳答案

这是解决我的问题的方法:

path = r"pathname\*_somename*.xlsx"
file_list = glob.glob(path)
for f in file_list:
    df = pd.read_excel(f, encoding='utf-8', decimal=',', thousands='.')
    for col in df.columns:
            w= (df[[col]].applymap(type) != df[[col]].iloc[0].apply(type)).any(axis=1)
            if len(df[w]) > 0:

                df[col] = df[col].astype(str)

            if df[col].dtype == list:
                df[col] = df[col].astype(str)
    pathname = f[:-4] + "ftr"
    df.to_feather(pathname)
df.head()

, decimal=',', thousands='.'部分是必要的，因为我的输入文件采用欧洲标准格式化，即使用逗号作为小数分隔符和点作为千位分隔符

关于python - 使用python将excel转换为 Feather 格式，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/61638115/

27

4

0

文章推荐： c# - OpenXML SpreadsheetDocument SaveAs() 给出文件使用错误

文章推荐： javascript - 获取 HTML 元素的值

文章推荐： excel - 下拉列表中的多项选择，但排除一个单元格

feather - 如何压缩和解压缩 Arrow 或 Feather 文件？
我计划将数据文件格式从 parquet 更改为 feather。 Parquet 有压缩选项(lz4 等)，我已经使用过它们。但我无法在 Feather 或箭头文件中找到它们。不支持压缩吗？最佳答案
python - 尝试将 DataFrame 写入 Feather 时出错。 feather 是否支持列表列？
我同时使用 R 和 Python，我想将我的一个 pandas DataFrame 编写为一个 feather，以便我可以在 R 中更轻松地使用它。但是，当我尝试将其编写为 feather 时，我得到
hook - Feathers - 限制服务响应仅限当前用户拥有的数据
在 Feathers 中，目标是将某个服务上可访问的数据限制为仅由当前登录用户拥有的数据。假设我使用的是 Feathers 认证，这个服务上可用的数据存储在一个数据库表中，包含用户 ID 的表列称为
feathersjs - Feathers auth 登录无效
我尝试使用本地身份验证，但收到错误消息“无效登录”。我从客户端发送“本地”授权。在服务器上接收数据 { strategy: 'local', email: 'email@gmail.co
python - 如何使用神经网络提取音频剪辑中 Feather 球击球声音的所有时间戳？
我正在尝试在取自 Feather 球比赛的源音频文件中查找其中一名球员击球的实例。出于同样的目的，我用正面(命中声音)和负面(没有命中声音:评论/人群声音等)标签标记了时间戳，如下所示: shot_t
python - 使用python将excel转换为 Feather 格式
我有一个(每天增长的)大约 100 个大 excel 文件的列表，我用 Python 对其进行分析。由于我必须对所有文件运行几个循环，我的分析变得越来越慢。因此，我想将所有 excel 文件转换为 F
python - 是否可以附加到现有的 Feathers 格式文件？
我正在处理一个包含 2000 万多条记录的非常庞大的数据集。我正在尝试将所有数据保存为 Feather 格式以便更快地访问，并在我继续分析时追加。有没有办法将 Pandas 数据帧附加到现有的 Fe
mysql - Feathers sequelize 按关联列查找
我正在尝试根据关联表的值过滤数据，当我查找全部时它工作正常但是当我尝试按名称搜索时，我得到一个列不存在错误我已经设置了一个钩子(Hook)，如 https://github.com/feathers
feathersjs - 将自定义身份验证策略添加到 Feathers 应用程序的正确方法是什么？
我的 Feathers 应用程序需要能够具有两种 JWT 身份验证策略。对于users服务，我需要有，例如，all: [authenticate('carrier')]而不是 all: [authen
javascript - Feathers JS 客户端超时
我确信这是非常简单的事情，但由于某种原因，我在尝试将feathersjs客户端与一个非常简单的jQuery应用程序集成时遇到超时。感兴趣的文件位于下面的 src 中。该存储库仅包含连接到 NedB 数
javascript - 如何在 Feathers 中创建异步超时错误处理程序？
如何创建一个异步函数超时错误处理程序作为驻留在服务文件中的 Feather 中的钩子(Hook)来处理钩子(Hook)中的 Promise？按照@Bergi on my previous quest
content-type - Feathers 中的任意响应内容类型
我有一项自定义服务，必须以 CSV 格式返回数据。我无法使用标准 Express 路由，因为我需要在此端点上使用 Feathers 的 Hook 。我找不到返回非 HTML、非 JSON 数据的
python - 转换为 FEATHER 文件会创建巨大的文件
我正在尝试将 .rds file进入.feather file用于在 Python 中使用 Pandas 进行阅读。 library(feather) # Set working directory
pandas - 您可以附加到 .feather 格式吗？
有没有办法使用 pd.to_feather 附加到 .feather 格式文件？我也很好奇是否有人知道最大文件大小方面的一些限制，以及在读取 .feather 文件时是否可以查询某些特定数据(例如读
python - 转换为 FEATHER 文件会创建巨大的文件
我正在尝试将 .rds file进入.feather file用于在 Python 中使用 Pandas 进行阅读。 library(feather) # Set working directory
javascript - Feather css 图标不工作
我应该使用 feather css 图标，但是图标在我的 mvc 元素上不起作用。我尝试更改文件路径，但它再次不起作用。 @font-face { font-family: "feather"
python - "Feather"PyCharm 库安装失败
我是 Python 的新手，我正在尝试下载 feather库，但出现错误。我已经更新了 pip 和 setuptools，但我仍然遇到错误。这是我从 PyCharm 获得的输出: Collec
javascript - Feathers Js 在服务器端限制对页面的访问
我正在使用 feathers.js 并尝试将对 payment-info.html 页面的访问限制为已登录的用户。 const app = feathers(); app.configure(conf
javascript - Feathers.js - 加载静态内容
我正在评估 feathers.js对于一个项目。我喜欢它的愿望。因此，我决定尝试构建一个基本的内容管理系统，作为一种学习努力。事情进行的还算顺利。但是，我想在应用程序启动时将一些静态内容(文章)加载到
javascript - Feathers JS - 创建多个条目 - 愚蠢的问题
按照文档，我意识到有一个允许批量创建的选项，但我不明白在哪里以及如何设置该选项，这里是代码: // Initializes the `test` service on path `/test` con

首页

博学

6Ren·AI

商城

python - 使用python将excel转换为 Feather 格式