gpt4 book ai didi

python - 使用django在textblob中缺少语料库错误

转载 作者:太空宇宙 更新时间:2023-11-03 11:26:23 26 4
gpt4 key购买 nike

我使用的是 Python 2.7、Django 1.8,我的服务器是 Linux Ubuntu 上的 Apache。我有一个包含 23000 条推文的 JSON 文件。我想根据预定义的类别对推文进行分类。但是当我运行代码时,它会抛出 MissingCorpusError at/ 并提示:

要下载必要的数据,只需运行

python -m textblob.download_corpora

我已经有了 TextBlob 的最新语料库。尽管如此,我还是收到了错误。

我的views.py如下:

def get_tweets(request):
retweet = 0
category = ''
sentiment = ''
tweets_data_path = STATIC_PATH+'/stream.json'
tweets_data = []
tweets_file = open(tweets_data_path, "r")
for line in tweets_file:
try:
tweet = json.loads(line)
tweets_data.append(tweet)
except:
continue
subs = []
for l in tweets_data:
s = re.sub("http[\w+]{0,4}://t.co/[\w]+","",l)
subs.append(s)
for t in subs:
i = 0
while i < len(t):
text = t[i]['tweet_text']
senti = TextBlob(text)
category = cl.classify(text)
if senti.sentiment.polarity > 0:
sentimen = 'positive'
elif senti.sentiment.polarity < 0:
sentimen = 'negative'
else:
sentimen = 'neutral'
if text.startswith('RT'):
retweet = 1
else:
retweet = 0
twe = Tweet(text=text,category=category,
sentiment=sentimen, retweet= retweet)
twe.save()
i = i+1
return HttpResponse("done")

最佳答案

我也遇到了同样的问题。当我下载 nltk_data 时,它被放置到/root/nltk_data/,当我将这个 nltk_data 文件夹复制到/var/www/时,它工作正常。

$ sudo cp -avr nltk_data/ /var/www/

关于python - 使用django在textblob中缺少语料库错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32577420/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com