gpt4 book ai didi

python-3.x - 非英语语料的词云

转载 作者:行者123 更新时间:2023-12-04 16:10:30 24 4
gpt4 key购买 nike

wordcloud for non English text

亲爱的 friend 们
我在为非英文文本生成正确的 wordcloud 时遇到问题。生成了云,但它给出了不满意的结果。它仅显示带有字符的 wordcloud,而我需要带有正确单词的 wordcloud。
我处理了以下代码以生成 wordcloud。

from os import path
from scipy.misc import imread
import matplotlib.pyplot as plt
import random
import unicodedata
from wordcloud import WordCloud, STOPWORDS
text = scorpus
wordcloud = WordCloud(font_path='MBKhursheed.ttf',
relative_scaling = 1.0,
stopwords = sw
).generate(text)
plt.imshow(wordcloud)
plt.axis("off")
plt.show()

最佳答案

首先你需要导入(可能先安装)这两个:

from arabic_reshaper import arabic_reshaper
from bidi.algorithm import get_display
然后将其用作以下内容:
text = get_display(arabic_reshaper.reshape(text))
wordcloud = WordCloud(font_path='MBKhursheed.ttf',
relative_scaling = 1.0,
stopwords = sw
).generate(text)

关于python-3.x - 非英语语料的词云,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42982824/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com