gpt4 book ai didi

python - 如何使用 pandas 读取其中项目是引用的文本文件

转载 作者:行者123 更新时间:2023-12-01 08:17:01 26 4
gpt4 key购买 nike

我有一个包含长文本的文件,每个文本都用双引号引起来,如下所示:

"blah1 balah1 ..... "
"blah2 blah2 ......."
"blah3 blah3 ......."
"...."

我想用这些项目制作一个包含一列(“文本”)的dataFrame。我尝试过:

data = pd.read_csv(data_path+'/test.csv')
data.head(10)

输出类似于:

blah1 blah1....
0 blah2 blah2
1 blah3 blah3
....

看起来除了第一行之外,其他行都可以检索。我怎样才能像其他人一样拥有第一行?

最佳答案

使用参数names指定列,则不需要header=None:

import pandas as pd

temp=u'''"blah1 balah1"
"blah2 blah2"
"blah3 blah3"'''
#after testing replace 'pd.compat.StringIO(temp)' to 'filename.csv'
df = pd.read_csv(pd.compat.StringIO(temp), names=['text1'])
print (df)
text1
0 blah1 balah1
1 blah2 blah2
2 blah3 blah3

关于python - 如何使用 pandas 读取其中项目是引用的文本文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54921575/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com