gpt4 book ai didi

python - 我需要访问文件进行处理。这些文件具有相同的数据,但每行具有不同的分隔符类型(空格、逗号、制表符)

转载 作者:太空宇宙 更新时间:2023-11-04 01:14:39 24 4
gpt4 key购买 nike

我需要访问文件进行处理。这些文件具有相同的数据但具有不同的每行的分隔符类型(空格、逗号、制表符)。

我的代码如下:

import os
import glob

DIR = "directory_path"
FILES = glob.glob(os.path.join(DIR, "*"))

for file in FILES:
if os.path.isfile(file):
content = open(file).readlines()
for lines in content:
line = lines.split(" " or "\t" or ":")
.
.
.
"processing content of line"

对于 ""的情况,线条分割得很好,但对于其他情况则不然。我如何处理不同的分隔符。

最佳答案

您可以导入 re 模块并利用其拆分功能来拆分文件的行。

import re
import os
import glob

DIR = "directory path"
FILES = glob.glob(os.path.join(DIR, "*"))

for file in FILES:
if os.path.isfile(file):
content = open(file).readlines()
for lines in content:
line = re.split(r'[\s,\t]\s*',lines)
.
.
.
process content per line

关于python - 我需要访问文件进行处理。这些文件具有相同的数据,但每行具有不同的分隔符类型(空格、逗号、制表符),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25416311/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com