python - textblob 教程中的 UnicodeDecodeError-6ren

python - textblob 教程中的 UnicodeDecodeError

转载作者：行者123 更新时间：2023-11-28 16:41:12

24

4

我正在尝试使用 Python 3.3 在 Windows 中运行 TextBlob 教程(使用 Git Bash shell)。

我已经安装了 textblob 和 nltk 以及任何依赖项。

Python代码是:

from text.blob import TextBlob

wiki = TextBlob("Python is a high-level, general-purpose programming language.")
tags = wiki.tags

我收到以下错误

Traceback (most recent call last):
File "textblob.py", line 4, in <module> 
  tags = wiki.tags
File "c:\Python33\lib\site-packages\text\decorators.py", line 18, in __get__ 
  value = obj.__dict__[self.func.__name__] = self.func(obj)
File "c:\Python33\lib\site-packages\text\blob.py", line 357, in pos_tags 
  for word, t in self.pos_tagger.tag(self.raw)
File "c:\Python33\lib\site-packages\text\taggers.py", line 40, in tag
  return pattern_tag(sentence, tokenize)
File "c:\Python33\lib\site-packages\text\en.py", line 115, in tag
  for sentence in parse(s, tokenize, True, False, False, False, encoding).split():
File "c:\Python33\lib\site-packages\text\en.py", line 99, in parse
  return parser.parse(unicode(s), *args, **kwargs)
File "c:\Python33\lib\site-packages\text\text.py", line 1213, in parse
  s[i] = self.find_tags(s[i], **kwargs)
File "c:\Python33\lib\site-packages\text\en.py", line 49, in find_tags
  return _Parser.find_tags(self, tokens, **kwargs)
File "c:\Python33\lib\site-packages\text\text.py", line 1161, in find_tags
  map = kwargs.get(     "map", None))
File "c:\Python33\lib\site-packages\text\text.py", line 967, in find_tags
  tagged.append([token, lexicon.get(token, i==0 and lexicon.get(token.lower()) or   None)])
File "c:\Python33\lib\site-packages\text\text.py", line 98, in get
  return self._lazy("get", *args)
File "c:\Python33\lib\site-packages\text\text.py", line 79, in _lazy
  self.load()
File "c:\Python33\lib\site-packages\text\text.py", line 367, in load
  dict.update(self, (x.split(" ")[:2] for x in _read(self._path) if x.strip()))
File "c:\Python33\lib\site-packages\text\text.py", line 367, in <genexpr>
  dict.update(self, (x.split(" ")[:2] for x in _read(self._path) if x.strip()))
File "c:\Python33\lib\site-packages\text\text.py", line 346, in _read
  for line in f:
File "c:\Python33\lib\encodings\cp1252.py", line 23, in decode
  return codecs.charmap_decode(input,self.errors,decoding_table)[0]
UnicodeDecodeError: 'charmap' codec can't decode byte 0x9d in position 16: character maps to <undefined>

知道这里出了什么问题吗？在字符串前添加 'u' 没有帮助。

最佳答案

0.7.1 版修复了这个问题，这意味着是时候了

$ pip install -U textblob

问题是用于词性标记的 en-lexicon.txt 文件使用 Windows 的默认平台编码 cp1252 打开文件。该文件显然包含 Python 无法从此编码解码的字符。已通过以 utf-8 模式显式打开文件解决此问题。

关于python - textblob 教程中的 UnicodeDecodeError，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/18987117/

24

4

0

文章推荐： python - celery - 倒计时如何工作？

文章推荐： Python 看门狗 : what is the 'empty' directory snapshot?

文章推荐： python - 如何通过外部脚本用scrapy获取爬虫返回数据？

文章推荐： python - 下载 twitch.tv 流的第一帧

c# - TextBlob 为空
我是第一次使用 SQLite，我正在做一个学生项目，我做了很多研究，但我无法解决我的问题。我正在尝试使用 sqlite-net-extensions，但我的 TextBlob 始终为空。如何使用 Wi
python - TextBlob，完全不准确
查看我们最近所做的一项调查的回复。我认为这位受访者不太高兴。在这里，TextBlob 让我相信他的情绪已经达到了积极的上限。如果我从字符串中删除“best”一词，情绪分数就会变为“0”。您能帮助我重
python.无法导入名称 'TextBlob'
我试图将 TextBlob 导入 Python。当我直接在 shell 中运行命令时，它运行良好: 从 textblob 导入 TextBlob 但是，当我将它放入py文件并运行它时，它不再起作用了
Python TextBlob 翻译问题
我正在使用 Python、TextBlob 和 NLTK 做一个快速的情绪分析控制台应用程序。目前我正在使用西类牙语 wiki 文章的链接，所以我不需要翻译它并且我可以使用 nltk 西类牙语停用词
python - TextBlob - 循环文章以计算极性和主观性分数
我正在研究 TextBlob 来计算我编译的 Excel 工作表上的文章列表的情绪分数(极性、主观性)。下面是工作表的示例: 11/03/2004 04:03 At least 60 people
python - 为数据框的每一行应用 textblob
我有一个数据框，其中包含一个包含文本的列。我想应用 textblob 并计算每一行的情绪值。 text sentiment 这很好好电影很棒的故事当我执行下面的代码时
python - TextBlob 翻译有限制吗？
我一直在使用 TextBlob，这是一个用于将文章翻译成不同语言的 Python 包 (https://pypi.python.org/pypi/textblob)。阅读他们的文档后，我了解到 Te
python - 安装 TextBlob 时出错
我正在尝试安装 TextBlob。根据官方文档，我这样做了。 > pip install -U textblob > python -m textblob.download_corpora pip 命
python - 如何找到带有 TextBlob 极性分数的单词列表或词典？
我需要带有 TextBlob 极性得分的总列表或字典。我搜索了很多在线网站，但找不到列表。我知道如何获得句子或单词的极性。我怎样才能找到它？最佳答案因为我们没有看到直接的 api 函数，也许你可以
python - TextBlob 如何计算情感极性？如何使用机器学习分类器计算情绪值？
TextBlob 如何计算情感极性的经验值。我使用过朴素贝叶斯，但它只是预测它是正数还是负数。我怎样才能像 TextBlob 那样计算情绪的值？最佳答案以下是该站点的示例:https://text
sentiment-analysis - Textblob 情感算法
有谁知道 textblob 情绪是如何运作的？我知道它基于 Pattern 工作，但我找不到任何文章或文档解释模式如何为句子分配极性值。最佳答案下面是 textblog 情感模块的代码: http
python - 如果某些行的列中的值丢失，如何应用 TextBlob？
我有一个如下所示的数据框: Text 0 this is amazing 1 nan 2 wow you are great 我想将数据帧单元格中的每个单词迭代到 text
python - 打开文本文件作为 textblob 的输入
我正在尝试将 textBlob 与文本文件输入一起使用。我在网上找到的所有示例都是在这个意义上的输入: wiki = TextBlob("Python is a high-level, genera
python - TextBlob 朴素贝叶斯。选择最高可能性
作为训练数据，以 XML 形式对餐馆进行评论，并带有相关的目标表达、所表达的情感、所属的离散标签类别以及对此所表达的极性: With the great variety on the menu , I
python - textblob 教程中的 UnicodeDecodeError
我正在尝试使用 Python 3.3 在 Windows 中运行 TextBlob 教程(使用 Git Bash shell)。我已经安装了 textblob 和 nltk 以及任何依赖项。 Pyt
python - 为 textblob 设置代理
我已经安装了textblob，我想进行简单的翻译。 >>> text="Hello" >>> blob=TextBlob(text) >>> blob.translate(to="es") 问题是，我
python - 无法使用 TextBlob 启动和运行
今天早上我开始安装位于 https://textblob.readthedocs.org/en/latest/index.html 的 TextBlob 模块根据我第一次运行的安装文档: pip i
Python:导入 textblob 库时出错
使用 Windows 10我已经使用“py -m pip install textblob”安装了 textblob。我可以导入 textblob，或者 from textblob import bl
python - 在数据框中的新列中返回 TextBlob 正、负或中性分类
我正在尝试根据 TextBlob 分类插入一个仅包含“正”或“负”字符串的新数据框列:对于我的 df 的第一行，结果是 ( pos , 0.75, 0.2499999999999997)我想要' 正
python - 为什么 TextBlob 不使用/检测否定？
我正在使用 TextBlob 执行情感分析任务。我注意到 TextBlob 在某些情况下能够检测到否定，而在其他情况下则不能。这是两个简单的例子 >>> from textblob.sentimen

首页

博学

6Ren·AI

商城

python - textblob 教程中的 UnicodeDecodeError