gpt4 book ai didi

python - NLTK 无法打开文件(UnicodeDecoreError)

转载 作者:太空宇宙 更新时间:2023-11-03 17:44:36 25 4
gpt4 key购买 nike

我有一个处理某些文件的任务,我需要使用 NLTK。我研究《哈利·波特》书籍和 J·K·罗琳的短篇小说。有些文件打开是clerale,我可以计算单词、句子等,但我有一个问题。当我尝试打开大文件时,我得到如下信息:https://pp.vk.me/c623420/v623420264/2d8b5/xE66_z6JWUs.jpg

请说一下到底是什么事情。

最佳答案

很可能是文件编码问题,因为我看不到您的代码或文件,我建议您在打开文件时尝试指定编码,然后再将其传递给 NLTK

import io
io.open('harrypotter.txt', encoding='ISO-8859-1') # Or other encoding of your file

关于python - NLTK 无法打开文件(UnicodeDecoreError),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30002972/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com