gpt4 book ai didi

python - 在 Python 中使用 nltk 出现非 ASCII 字符错误

转载 作者:太空宇宙 更新时间:2023-11-03 16:51:26 25 4
gpt4 key购买 nike

我正在尝试使用以下链接中给出的解决方案代码:Unicode Tagging in Python NLTK

omerbp给出的解决方案中:

from nltk.corpus import indian
from nltk.tag import tnt

train_data = indian.tagged_sents('hindi.pos')
tnt_pos_tagger = tnt.TnT()
tnt_pos_tagger.train(train_data) #Training the tnt Part of speech tagger with hindi data

print tnt_pos_tagger.tag(nltk.word_tokenize(word_to_be_tagged))

我收到以下错误:

'SyntaxError: Non-ASCII character '\xe0' in file q12.py on line 1, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details' in line 1.

最佳答案

将这两行添加到文件顶部:

#!/usr/bin/python
# -*- coding: utf-8 -*-

它们将指示解释器将每个字符编码为 UTF-8 而不是 ASCII。

关于python - 在 Python 中使用 nltk 出现非 ASCII 字符错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35810558/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com