gpt4 book ai didi

python - 如何将标记化数据框转换为字符串以生成词云

转载 作者:太空宇宙 更新时间:2023-11-04 02:11:51 24 4
gpt4 key购买 nike

所以我正在将 excel 文件读入数据框,然后对其进行规范化(小写、停用词等)

现在我的数据框有来自 excel 文件的多个列,但只有我需要的列,它看起来像下面这样。我必须将其标记化。

df['col1']

0 [this, is , fun, interesting]
1 [this, is, fun, too]
2 [ even, more, fun]

我有更多类似的列,如 df['col2'] 等等。

现在我要生成词云

from wordcloud import WordCloud
text = WordCloud().generate(df['col'])
plt.imshow(text)
plt.axis("off")
plt.show()

我正在尝试生成一个词云,但这不起作用,因为显然词云需要一个字符串。如何将我的整个数据框转换为字符串?

我想将整个数据框转换为字符串,然后生成一个词云,但如果这不可能,那么每列至少一个词云会很好。

最佳答案

您只需要将您的列转换为 string,因为到目前为止您只有 WordCloud 无法接受的字符串 list。简单地说,

text = WordCloud().generate(df['col1'].to_string())

你的输出图像是 enter image description here

关于python - 如何将标记化数据框转换为字符串以生成词云,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53587128/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com