gpt4 book ai didi

python - 如何将带有多个字符的定界符的 .text 解析为 pandas df?

转载 作者:太空宇宙 更新时间:2023-11-03 13:11:16 25 4
gpt4 key购买 nike

我有一个大型 数据集,我想用 pandas 在 python 中进行分析。它全部包含在 .txt 中,但分隔符是+++$+++。我该如何解析呢?

import pandas as pd
df = pd.read_csv('filename.txt', sep='+++$+++', header=None)

这两行引发了这个错误:

sre_constants.error: nothing to repeat

最佳答案

那是因为如果分隔符长于 1 个字符,它将被解释为正则表达式,如 http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html 中所述;所以 + 表示“前面字符的任意数量的匹配项”,没有,所以“没有什么可重复的”。

我认为转义符号可能有效。

关于python - 如何将带有多个字符的定界符的 .text 解析为 pandas df?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43017719/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com