gpt4 book ai didi

python 解析制表符分隔的文件

转载 作者:行者123 更新时间:2023-12-01 01:53:39 26 4
gpt4 key购买 nike

对 python 还很陌生

我想解析一个带有\t 分隔值的文件,如下图。如何从文件中删除\t 并将值分成列?代码如下。

import pandas as pd
import io
import requests
url = "https://archive.ics.uci.edu/ml/machine-learning-databases/00236/seeds_dataset.txt"
s = requests.get(url).content
df = pd.read_csv(io.StringIO(s.decode('utf-8')))

How it looks right now

How i want it to look

最佳答案

sep="\t" 添加到 pd.read_csv 中。数据比较乱,需要更换双tab:

df = pd.read_csv(
io.StringIO(s.decode('utf-8').replace("\t\t", "\t")),
header=None, sep="\t")

关于python 解析制表符分隔的文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50464149/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com