gpt4 book ai didi

python - 将制表符分隔的 .txt 解析为 Pandas DataFrame

转载 作者:行者123 更新时间:2023-12-01 21:46:01 25 4
gpt4 key购买 nike

我有一个制表符分隔的 .txt 文件,我试图将其导入到 Python 中的数据框中,其格式与文本文件相同,如下所示:

火腿 TAB 一直走到裕廊点,疯了.. 只在 bugis n great world la e buffet 有售... Cine there got amore wat...

垃圾邮件 TAB 2005 年 5 月 21 日免费参加每周 2 场比赛以赢得足总杯决赛 tkts。发短信给 FA 至 87121 以接收参赛问题(std txt 率)T&C's申请 0845281007518 岁以上

...

请注意,上面的内容还有很多行(大约 5500 行)我想传递给 Python 并在从中创建矩阵数组时保持相同的格式。

我目前的代码是:

 import pandas as pd 

with open("SMSSpamCollection.txt") as f:
reader = csv.reader(f, delimiter = "\t")
d = list(reader)
d = pd.DataFrame(reader)

它稍微完成了我需要它做的事情,但我想要一个包含 2 列的 DataFrame:Y(包含垃圾邮件或垃圾邮件)和第二个 X(包含消息)。这时我得到了一个[5572,2] DataFrame。

最佳答案

这个怎么样:

import pandas as pd 
d = pd.read_csv("SMSSpamCollection.txt", sep="\t", names=['Y','X'])

关于python - 将制表符分隔的 .txt 解析为 Pandas DataFrame,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60571932/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com