gpt4 book ai didi

python-3.x - 将 Pandas 数据帧转换为 utf8

转载 作者:行者123 更新时间:2023-12-04 11:01:35 27 4
gpt4 key购买 nike

如何将 Pandas 数据帧转换为 unicode?

`messages=pandas.read_csv('data/SMSSpamCollection',sep='\t',quoting=csv.QUOTE_NONE,names=["label", "message"])
def split_into_tokens(message):
message = unicode(message, 'utf8') # convert bytes into proper unicode
return TextBlob(message).words


messages.head().apply(split_into_tokens(messages))`

它给出了错误
Traceback (most recent call last):
File "minor.py", line 46, in <module>
messages.head().apply(split_into_tokens(messages))
File "minor.py", line 42, in split_into_tokens
message = unicode(message, 'utf8') # convert bytes into proper unicode
TypeError: coercing to Unicode: need string or buffer, DataFrame found

最佳答案

更改代码

messages.head().apply(split_into_tokens(messages))


messages.head().apply(split_into_tokens)

虽然在您的情况下使用具有功能的“apply”,但不需要传递参数,因为您的代码显示它正在传递一个在执行时出错的数据帧。

关于python-3.x - 将 Pandas 数据帧转换为 utf8,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42456867/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com