gpt4 book ai didi

python - 为什么我无法实现字符串的解码功能?

转载 作者:行者123 更新时间:2023-11-30 22:00:40 29 4
gpt4 key购买 nike

我正在研究数据集并重新运行我同事的代码。当标记文本数据时,下面显示的代码在我的 MacBook 上不起作用,但是在我同事的计算机上运行良好。以下是代码。

我不知道他有哪个版本,但我的是python3.6。是版本不同的问题吗?

s=title+' '+author+' '+text
tokens=word_tokenize(s.decode('ascii','ignore').lower())
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
<ipython-input-8-e50403f82604> in <module>
10 flushPrint(m/100)#208
11 s=title+' '+author+' '+text
---> 12 tokens=word_tokenize(s.decode('ascii','ignore').lower())
13 tokens = [z for z in tokens if not z in stopset and len(z)>1]
14 k=[]

AttributeError: 'str' object has no attribute 'decode'

最佳答案

该问题很可能是由于 python2 和 python3 之间的更改造成的

在 python2 中

  • '' 的类型为 str,因此支持 ''.decode()
  • u'' 的类型为 unicode,因此支持 u''.encode()

在 python3 中这是相反的

  • '' 的类型为 unicode,因此支持 ''.encode()
  • u'' 的类型为 byte,因此支持 u''.decode()

因此,在您的情况下,根据变量的类型,您可能需要执行类似的操作

s = title + b' ' + author + b' ' + text

只求助于 python 2 :)

关于python - 为什么我无法实现字符串的解码功能?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54256153/

29 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com