gpt4 book ai didi

python - 仅使用python中的csv阅读器读取csv文件的前N行

转载 作者:行者123 更新时间:2023-12-04 14:31:24 24 4
gpt4 key购买 nike

我将多个 csv 文件的第二列中包含的文本添加到一个列表中,以便稍后对列表中的每个项目执行情绪分析。我的代码目前完全适用于大型 csv 文件,但我对列表中的项目执行的情绪分析花费的时间太长,这就是为什么我只想读取每个 csv 文件的前 200 行。代码如下所示:

import nltk, string, lumpy 
import math
import glob
from collections import defaultdict
columns = defaultdict(list)
from nltk.corpus import stopwords
import math
import sentiment_mod as s
import glob

lijst = glob.glob('21cf/*.csv')

tweets1 = []
for item in lijst:
stopwords_set = set(stopwords.words("english"))
with open(item, encoding = 'latin-1') as d:
reader1=csv.reader(d)
next(reader1)
for row in reader1:
tweets1.extend([row[2]])
words_cleaned = [" ".join([words for words in sentence.split() if 'http' not in words and not words.startswith('@')]) for sentence in tweets1]
words_filtered = [e.lower() for e in words_cleaned]
words_without_stopwords = [word for word in words_filtered if not word in stopwords_set]
tweets1 = words_without_stopwords
tweets1 = list(filter(None, tweets1))

如何确保使用 csv 阅读器仅读取每个 csv 文件的前 200 行?

最佳答案

最短最惯用的方式大概就是用 itertools.islice :

import itertools
...
for row in itertools.islice(reader1, 200):
...

关于python - 仅使用python中的csv阅读器读取csv文件的前N行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50490257/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com