gpt4 book ai didi

python pandas read_csv 在制表符分隔文件中无法识别\t

转载 作者:太空狗 更新时间:2023-10-29 22:20:57 27 4
gpt4 key购买 nike

我正在尝试将以下选项卡中的分隔数据读入 pandas:
测试.txt:

col_a\tcol_b\tcol_c\tcol_d
4\t3\t2\t1
4\t3\t2\t1

我按如下方式导入 test.txt:

pd.read_csv('test.txt',sep='\t')

生成的数据框有 1 列。\t 未被识别为制表符。

如果我将\t 替换为“键盘选项卡”,文件将被正确解析。我也尝试用\t 和/t 替换 '\t 并且没有任何运气。

在此先感谢您的帮助。
奥马尔

PS:截图http://imgur.com/a/nXvW3

最佳答案

文件中的 \t 是一个实际的反斜杠后跟一个 t。它不是标签。您将不得不在 sep 参数上使用一些转义字符。

pd.read_csv('test.txt', sep=r'\\t', engine='python')

col_a col_b col_c col_d
0 4 3 2 1
1 4 3 2 1

或者

pd.read_csv('test.txt', sep='\\\\t', engine='python')

col_a col_b col_c col_d
0 4 3 2 1
1 4 3 2 1

response to comment

r 表示它是原始字符串,特殊字符应解释为原始字符。这就是为什么在一个解决方案中我指出该字符串是原始字符串并且只有两个反斜杠。另一方面,我不得不用另一个反斜杠转义每个反斜杠,留下四个反斜杠。

关于python pandas read_csv 在制表符分隔文件中无法识别\t,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45443406/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com