gpt4 book ai didi

python - 使用 Pandas 导入时,如何跳过 .txt 文件中值多于/少于 6 的行

转载 作者:行者123 更新时间:2023-12-01 03:03:41 28 4
gpt4 key购买 nike

我有一个 170k 行的 .txt 文件。我正在将 txt 文件导入 Pandas 。

每行都有许多用逗号分隔的值。
我想提取具有 9 个值的行。

The data file snippet

我目前正在使用:

data = pd.read_csv('uart.txt', sep=",")

最佳答案

您应该尝试的第一件事 - 预处理文件。

import csv
with open('uart.txt', 'r') as inp, open('uart_processed.txt', 'w') as outp:
inp_csv = csv.reader(inp)
outp_csv = csv.writer(outp)
for row in inp_csv:
if len(row) == 9:
outp_csv.writerow(row)

可以有更有效的方法来做到这一点,但它是您可以做的最简单的事情,它会完全删除无效行。

正如@ksooklall 回答的那样,如果为了简单起见,您只需要 2 列:
  • [a,b,c,d] 将在您的 DataFrame 中作为 [a, b]
  • [e] 为 [e, Nan]

  • 所以,如果你同意的话 - 继续,不需要预处理。

    关于python - 使用 Pandas 导入时,如何跳过 .txt 文件中值多于/少于 6 的行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59494831/

    28 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com