gpt4 book ai didi

python - 使用 pandas 系列从文件中获取文件夹路径

转载 作者:行者123 更新时间:2023-12-01 08:48:17 24 4
gpt4 key购买 nike

我正在使用 pandas 处理文件路径列表,我需要提取文件夹路径。

所以来自:

/volume1/SYN/FOLDER1/FILE.TXT
/volume1/SYN/FOLDER2/SUBFOLDER/FILE.PDF

我需要获取文件夹路径:

/volume1/SYN/FOLDER1/
/volume1/SYN/FOLDER2/SUBFOLDER/

我找到了一种获取文件名但不获取文件夹路径的方法

data['index'] = data['File'].str.split('/').str[-1]

有什么想法吗?

最佳答案

您可以使用os.path.splitext并通过列表理解或使用自定义函数apply提取第一个分割。

from os.path import splitext

df = pd.DataFrame({'filepaths': [r'/volume1/SYN/FOLDER1/FILE.TXT',
r'/volume1/SYN/FOLDER2/SUBFOLDER/FILE.PDF']})

# list comprehension, more efficient
df['folder'] = [splitext(x)[0] for x in df['filepaths']]

# apply + lambda implicit loop
df['folder'] = df['filepaths'].apply(lambda x: splitext(x)[0])

print(df)

filepaths \
0 /volume1/SYN/FOLDER1/FILE.TXT
1 /volume1/SYN/FOLDER2/SUBFOLDER/FILE.PDF

folder
0 /volume1/SYN/FOLDER1/FILE
1 /volume1/SYN/FOLDER2/SUBFOLDER/FILE

关于python - 使用 pandas 系列从文件中获取文件夹路径,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53224723/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com