python - 使用 Python 循环处理多个 csv 文件并从特定列的非空单元格中提取行-6ren

python - 使用 Python 循环处理多个 csv 文件并从特定列的非空单元格中提取行

转载作者：太空宇宙更新时间：2023-11-03 20:16:14

25

4

我编写了一个代码来处理许多 csv 文件。对于其中的每一个，我想提取与名为“20201-2.0”的列的非空单元格相对应的所有行。看一下附加的示例(这是 LCE 列):

https://uoe-my.sharepoint.com/personal/gpapanas_ed_ac_uk/_layouts/15/onedrive.aspx?id=%2Fpersonal%2Fgpapanas%5Fed%5Fac%5Fuk%2FDocuments%2FCSV%20File%20screenshot%2EPNG&parent=%2Fpersonal%2Fgpapanas%5Fed%5Fac%5Fuk%2FDocuments&originalPath=aHR0cHM6Ly91b2UtbXkuc2hhcmVwb2ludC5jb20vOmk6L2cvcGVyc29uYWwvZ3BhcGFuYXNfZWRfYWNfdWsvRWF5QmJsRlRIbVZKdlJmc0I2aDhWcjRCMDlJZmpRMkwxSTVPUUtVTjJwNXd6dz9ydGltZT10V2Y0c2Q1UzEwZw

我编写了以下代码来执行此操作:

import pandas as pd
import glob
import os

path = './'
#column = ['20201-2.0']

all_files = glob.glob(path + "/*.csv")

for filename in all_files:

    # Option 1 below worked, although without isolating the non-nulled values
    # 1. df = pd.read_csv(filename, encoding="ISO-8859-1")
    df = pd.read_csv(filename, header = 0)
    df = df[df['20201-2.0'].notnull()]

    print('extracting info from cvs...')
    print(df)

    # You can now export all outcomes in new csv files
    file_name = filename + 'new' + '.csv'
    save_path = os.path.abspath(
        os.path.join(
            path, file_name
        )
    )
    print('saving ...')
    export_csv = df.to_csv(save_path, index=None)

    del df
    del export_csv

但是，虽然我设法生成第一个文件，但出现以下错误:

Traceback (most recent call last):
  File "/home/anaconda3/lib/python3.7/site-packages/pandas/core/indexes/base.py", line 2657, in get_loc
    return self._engine.get_loc(key)
  File "pandas/_libs/index.pyx", line 108, in pandas._libs.index.IndexEngine.get_loc
  File "pandas/_libs/index.pyx", line 132, in pandas._libs.index.IndexEngine.get_loc
  File "pandas/_libs/hashtable_class_helper.pxi", line 1601, in pandas._libs.hashtable.PyObjectHashTable.get_item
  File "pandas/_libs/hashtable_class_helper.pxi", line 1608, in pandas._libs.hashtable.PyObjectHashTable.get_item
KeyError: '20201-2.0'

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
  File "/home/PycharmProjects/OPTIMAT/Read_MR_from_all_csv.py", line 21, in <module>
    df = df[df['20201-2.0'].notnull()]
  File "/home/giorgos/anaconda3/lib/python3.7/site-packages/pandas/core/frame.py", line 2927, in __getitem__
    indexer = self.columns.get_loc(key)
  File "/home/anaconda3/lib/python3.7/site-packages/pandas/core/indexes/base.py", line 2659, in get_loc
    return self._engine.get_loc(self._maybe_cast_indexer(key))
  File "pandas/_libs/index.pyx", line 108, in pandas._libs.index.IndexEngine.get_loc
  File "pandas/_libs/index.pyx", line 132, in pandas._libs.index.IndexEngine.get_loc
  File "pandas/_libs/hashtable_class_helper.pxi", line 1601, in pandas._libs.hashtable.PyObjectHashTable.get_item
  File "pandas/_libs/hashtable_class_helper.pxi", line 1608, in pandas._libs.hashtable.PyObjectHashTable.get_item
KeyError: '20201-2.0'

我不明白为什么会发生这种情况。任何想法将不胜感激。

最佳答案

很高兴地说我找到了一种方法来做到这一点:

import pandas as pd
import glob
import os
import numpy as np

path = './'
#column = ['20201-2.0']

# all_files = glob.glob(path + "/*.csv")

#li = []
all_files = os.listdir(path)
all_df = pd.DataFrame()
for filename in all_files:
    if not filename.endswith('csv'):
        continue

    print('extracting info from ' + filename)
    # Option 1 below worked, although without isolating the non-nulled values
    # 1. df = pd.read_csv(filename, encoding="ISO-8859-1")
    df = pd.read_csv(filename, header=0)
    #df = df[df['20201-2.0'].notnull()]

    df_subset = df.dropna(subset=['20201-2.0'])
    print('processed ' + filename)

    # You can now export all outcomes in new csv files
    file_name = filename.split('.')[0] + '_new' + '.csv'

    print('saving to' + file_name)
    export_csv = df_subset.to_csv('./' + file_name, index=None)

    del df
    del export_csv

关于python - 使用 Python 循环处理多个 csv 文件并从特定列的非空单元格中提取行，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/58428610/

25

4

0

文章推荐： python - 在 Python 中打包相邻整数

文章推荐： javascript - Canvas 外菜单和固定位置的标题

文章推荐： css - 使用 :after only on certain divs

文章推荐： python - Django 编码 - 为什么需要返回两个相同的参数？

html - 影响每第三个元素/格
我已经尝试在我的 CSS 中添加一个元素来删除每三个 div 的 margin-right。不过，似乎只是出于某种原因影响了第 3 次和第 7 次。需要它在第 3、6、9 等日工作... CSS .s
animation - CSS3 格 'pulse'
如何使 div/input 闪烁或“脉冲”？例如，假设表单字段输入了无效值？最佳答案使用 CSS3 类似 on this page ，您可以将脉冲效果添加到名为 error 的类中: @-webk
R 格 : Removing the wireframe mesh
我目前正在尝试构建一个简单的 wireframe来自 lattice 的情节包，但由沿 y 轴的数百个点组成。这导致绘图被线框网格淹没，您看到的只是一个黑色块。我知道我可以用 col=FALSE 完全
CSS 格[编号| ="subPane"]错误
在知道 parent>div CSS 选择器在 IE 中无法识别后，我重新编码我的 CSS 样式，例如: div#bodyMain div#paneLeft>div{/*styles here*/}
html - CSS 格 :hover exclusion
我有两个 div，一个在另一个里面。当我将鼠标悬停到最外面的那个时，我想改变它的颜色，没问题。但是，当我将鼠标悬停到内部时，我只想更改它的颜色。这可能吗？换句话说，当将鼠标悬停到内部 div 上
flutter - 格 subview 构建器，其项目的随机宽度 flutter
我需要展示这样的东西有人可以帮忙吗？我可以实现以下输出我正在使用以下代码:: GridView.builder( scrollDirection: Axis.vertical,
android - 复制键盘布局，向上插入 Bottom Sheet 格
当 Bottom Sheet 像 Android 键盘一样打开时，是否有任何方法可以手动上推布局( ScrollView 或回收器 View 或整个 Activity )？或者你可以说我想以 Bott
css - Safari 4 格 :hover Support
我有以下代码，用于使用纯 HTML 和 CSS 显示翻转。当您将鼠标悬停在文本上时，它会更改左右图像。在我测试的所有浏览器中都运行良好，Safari 4 除外。据我收集的信息，Safari 4 支持
html - 带 Bootstrap 的图像，打破列/格
我构建了某种 CMS，但在使用 TinyMCE 和 Bootstrap 时遇到了一些问题。我有一个页面，其中概述了一个 div，如果用户单击该 div，他们可以从模态中选择图像。该图像被插入到一个
CSS 格 :hover with transition only applying to one element?
出于某种原因，当我设置一个过渡时，当我的鼠标悬停在一个元素上时，背景会改变颜色，它只适用于一个元素，但它们都共享同一个类？任何帮助我的 CSS .outer_ad { position:rel
android-studio - 缺少 Android Studio 调试监 window 格
好吧，这真的很愚蠢。我不知道 Android Studio 中的调试监视框架发生了什么。我有 1.5.1 的工作室。是否有一些来自 intellij 的 secret 知识来展示它。最佳答案与以
css - 3 格 : one centered and the two others one in each side
我有这个标记: some code > 我正在尝试获取此布局: 注意:上一个和下一个按钮靠近#player 我正在尝试这样: .nextBtn{
CSS 格 :hover per menu item having Child and Sibling Selectors issue
网站:http://avuedesigns.com/index 首页有 6 个菜单项。我希望每件元素在您经过时都有自己的颜色。这是当您将鼠标悬停在 div 上时将所有内容更改为白色的行 li#hom
php - 在 Joomla 中，如何为 index.php 创建 3x3(9 格)代码？
我需要在 index.php 文件中显示它，但没有任何效果。我所有的文章都没有正确定位。我将其用作代码: 最佳答案您可以首先检查您

首页

博学

6Ren·AI

商城

python - 使用 Python 循环处理多个 csv 文件并从特定列的非空单元格中提取行