gpt4 book ai didi

python - 读取 CSV 文件并跳过行,直到我们使用 python 找到某些列

转载 作者:行者123 更新时间:2023-12-03 07:56:32 24 4
gpt4 key购买 nike

我想使用 python 通过跳过行在条件后动态读取 CSV 文件。

条件 - 每当我在 CSV 中发现 6 列时,或者当我发现列名称序列与这 6 列相同时。

文件.csv

Col1,col2,col3

1,2,3

13,u,u

,,,

,,,

Col1,col2,col3,col4

1,2,3,4

13,u,u,y

,,,

,,,

Col1,col2,col3,col4,col5,col6

1,2,3,4,5,6

qw,ers,hh,yj,df,ji

现在我正在使用 pandas.read_csv() 读取此文件

我知道在第 10 行我需要列。

pandas.read_csv("file.csv",skiprows=10, header=None)

当我们有 6 列或按此序列 col1、col2、col3、col4、col5、col6 时,想要通过跳过行来动态跳过此操作。

start =  df.loc[df.FILE-START == 'col1,col2,col3,col4,col5,col6'].index[0]
df = pd.read_csv(filename, skiprows = start + 1)

尝试过,但不起作用。

最佳答案

更新

使用csv模块的更强大的版本:

import pandas as pd
import csv
import io

with open('File.csv') as fp:
while True:
pos = fp.tell()
reader = csv.reader(io.StringIO(fp.readline()))
row = next(reader)
if len(row) == 6:
break
fp.seek(pos)
df = pd.read_csv(fp)

旧答案

您可以逐行读取文件,直到找到 6 列或 5 个逗号(请注意它们之间是否有引号和逗号。但这对于简单的 csv 文件来说没问题:

import pandas as pd

with open('File.csv') as fp:
while True:
pos = fp.tell()
row = fp.readline()
if row.count(',') == 5:
break
fp.seek(pos)
df = pd.read_csv(fp)

输出:

>>> df
Col1 col2 col3 col4 col5 col6
0 1 2 3 4 5 6
1 qw ers hh yj df ji

关于python - 读取 CSV 文件并跳过行,直到我们使用 python 找到某些列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/75908066/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com