gpt4 book ai didi

python - 阻止 Pandas Dataframe 'float' 对象没有属性 'split'

转载 作者:行者123 更新时间:2023-11-30 22:26:40 25 4
gpt4 key购买 nike

import pandas as pd
from nltk.stem import PorterStemmer, WordNetLemmatizer
porter_stemmer = PorterStemmer()

df = pd.read_csv("last1.csv",sep=',',header=0,encoding='utf-8')

df['rev'] = df['reviewContent'].apply(lambda x : filter(None,x.split(" ")))

Dataset

我正在尝试阻止我的数据框。在标记化时,我收到此错误

df['rev'] = df['reviewContent'].apply(lambda x : filter(None,x.split(" ")))

属性错误:“float”对象没有属性“split”

在使用词干分析时,我也遇到了 float 问题

df['reviewContent'] = df["reviewContent"].apply(lambda x: [stemmer.stem(y) for y in x])

类型错误:“ float ”对象不可迭代

我能做什么?

最佳答案

对数据进行标记化时,您不需要 apply 调用。 str.split 应该就可以了。此外,您可以分割多个空格,因此您不必寻找空字符串。

df['rev'] = df['reviewContent'].astype(str).str.split()

您现在可以像以前一样运行词干分析器:

df['rev'] = df['rev'].apply(lambda x: [stemmer.stem(y) for y in x])

关于python - 阻止 Pandas Dataframe 'float' 对象没有属性 'split',我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47162644/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com