- ubuntu12.04环境下使用kvm ioctl接口实现最简单的虚拟机
- Ubuntu 通过无线网络安装Ubuntu Server启动系统后连接无线网络的方法
- 在Ubuntu上搭建网桥的方法
- ubuntu 虚拟机上网方式及相关配置详解
CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.
这篇CFSDN的博客文章用Python和WordCloud绘制词云的实现方法(内附让字体清晰的秘笈)由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.
环境及模块:
目标:
绘制安徽省2018年某些科技项目的词云,直观展示热点.
思路:
先提取项目的名称,再用jieba分词后提取词汇;过滤掉“研发”、“系列”等无意义的词;最后用wordcloud 绘制词云.
扩展:
词云默认是矩形的,本代码采用图片作为蒙版,产生异形词云图。这里用的图片是安徽省地图.
秘笈:
用网上的常规方法绘制的词云,字体有点模糊,秘笈在最后点明.
正式开始,show you the code:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
|
import
numpy as np
from
pil
import
image
import
re
import
jieba
from
wordcloud
import
wordcloud,imagecolorgenerator,stopwords
import
matplotlib.pyplot as plt
# http://www.cnblogs.com/hatemath/
# 打开存放项目名称的txt文件
with
open
(
'content.txt'
,
'r'
,encoding
=
'utf-8'
) as f:
word
=
(f.read())
f.close()
# 图片模板和字体
image
=
np.array(image.
open
(
'ditu.jpg'
))
font
=
r
'c:\\windows\\fonts\\msyh.ttf'
# 去掉英文,保留中文
resultword
=
re.sub(
"[a-za-z0-9\[\`\~\!\@\#\$\^\&\*\(\)\=\|\{\}\'\:\;\'\,\[\]\.\<\>\/\?\~\。\@\#\\\&\*\%]"
, "",word)
wordlist_after_jieba
=
jieba.cut(resultword)
wl_space_split
=
" "
.join(wordlist_after_jieba)
# 设置停用词
sw
=
set
(stopwords)
sw.add(
"研发"
)
sw.add(
"系列"
)
sw.add(
"这里不多写了,根据自己情况添加"
)
# 关键一步
my_wordcloud
=
wordcloud(scale
=
4
,font_path
=
font,mask
=
image,stopwords
=
sw,background_color
=
'white'
,
max_words
=
100
,max_font_size
=
60
,random_state
=
20
).generate(wl_space_split)
#显示生成的词云
plt.imshow(my_wordcloud)
plt.axis(
"off"
)
plt.show()
#保存生成的图片
my_wordcloud.to_file(
'result.jpg'
)
|
其中 ditu.jpg 为安徽省轮廓图片:
运行结果:
可以看到,智能设备、施工工法、系统平台、电缆、机器人等都是出现较多的词汇.
最后是秘笈揭晓时间:
为什么我这张图如此清晰?打开原图可以看到,这图的分辨率是1800*2500。你用网上的大多数代码,最后生成的图,尺寸很小,上面字迹边缘模糊.
关键在于调用wordcloud时的一个参数,回放一下代码:
1
2
3
|
# 关键一步
my_wordcloud
=
wordcloud(scale
=
4
,font_path
=
font,mask
=
image,stopwords
=
sw,background_color
=
'white'
,
max_words
=
100
,max_font_size
=
60
,random_state
=
20
).generate(wl_space_split)
|
第一个参数我写的是 scale=4,这个数值越大,产生的图片分辨率越高,字迹越清晰。你可以调到64试试,我希望你的电脑足够快 /笑哭 。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持我.
原文链接:http://www.cnblogs.com/hatemath/p/10238145.html 。
最后此篇关于用Python和WordCloud绘制词云的实现方法(内附让字体清晰的秘笈)的文章就讲到这里了,如果你想了解更多关于用Python和WordCloud绘制词云的实现方法(内附让字体清晰的秘笈)的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。
你知道更好的写法吗 font = font ? font : defaultFont; 我所知道的是: if(!font) { font = defaultFont } 我知道这是一个小工具问
我正在编写代码,但无法编译,即使类(字体)已通过 import javafx.scene.text.*; 导入我知道这个方法font包含在字体中。 这是我的代码: package helloworld
我已经构建了一个按钮,但在格式设置(即平方、内联文本等)方面遇到了问题 我目前的问题是:正文分为2部分- 上线正常-下一行是较大的字体大小 我的动画 react 正确,但文本应该在箭头的顶线和底线内。
好的,所以我想在网页上使用固定系统作为字体。我可以使用 Cufon,但我希望人们能够在鼠标悬停时选择文本并复制它。 有人有什么吗? 最佳答案 我使用 fontsquirrel 的 @font-face
我找到了 iOS 4.2 可用字体列表(链接 here ),但该列表与早期版本的 SDK 略有不同(链接 here )。 我可以很好地更改代码中的字体,但如果我使用 iOS 4.2 列表中可用的字体,
我正在尝试更改 TableView 标题上的字体颜色,其中显示“加利福尼亚/纽约”。我该怎么做? 在黑色背景上,文本需要是白色的,但无法弄清楚这一点。 谢谢 最佳答案 如果您尝试更改标题颜色,可以使用
假设我想使用 java.awt.Graphics.drawString(String str, int x, int y)在某些特定坐标处绘制字符串的方法,例如 (300, 300)。然而drawSt
我想使用Puppeteer从HTML字符串生成图像。现在我有这样的事情: const html = _.template(` Hello {{ test }}!
我正在创建一个游戏。我有一些带有文本的用户界面。最近我们想添加日语版本,但我遇到字体问题。我使用 stb_freetype 来光栅化字体,并且我支持 Unicode,所以这应该不是问题。但大多数字体似
我可以在一个文本区域中使用不同的前景色吗?不同的字体? 我想添加类似“hh:mm:ss 昵称:消息”的内容,时间为灰色,名称 - 蓝色,消息 - 黑色。 最佳答案 我在评论中犯了一个错误:你想要的是
每次我更改字体时,它都会返回到默认大小,即 12,即使我之前使用“ Jade 野”菜单更改它,它每次也只会返回到 12,我的猜测是这样我使用deriveFont()更改大小,但现在没有其他方法可以更改
我的电脑上安装了一种名为“BMW1”的自定义字体。我试图循环遍历此字体中的所有条目并将它们显示在 JTextArea 中。 我有以下代码: JTextArea displayArea = new JT
我尝试通过 Squirrel 理解生成的代码,这里是输出: @font-face { font-family: 'someFont'; src: url('someFont.eot')
我知道有多种方法可以通过 JS/DHTML 动态更改网页的字体属性,或者用 Flash 呈现的字体(使用 sIFR 或 Cufon)替换文本。但是,我找不到任何根据用户选择动态更改网页上使用的字体的好
使用具有非标准样式名称(例如“Inline”或“Outline”)而不是标准样式(例如“Bold”和“Italic”)的字体系列,如何使用 css 选择字体的不同样式? 设置 font-family
我对 html/css 有点陌生,我正在制作我的第一个网站,但我只是想不通一些东西。 首先,我在 dreaweaver 中工作...在 dreaweaver 中,一切看起来都不错,但是当我预览时,我缺
有没有办法在 Allegro5 中只绘制(或显示)图像/字体的一部分? 例如,如果我有一个正方形 A 和一个图像 B,我只想绘制/显示 B 中与 A(在本例中为 C)重叠的部分,我该怎么做? 插图:
所以,我有一个正在生成的报告 html 文件,其中有需要白色文本/字体的黑框。在通用 html 显示中一切都很好,但是当我尝试打印页面时,ctrl + p 或自定义打印功能,文本/字体保持为标准颜色,
我正在尝试制作一个非常适合 LaTeX 文档的 matlab 图形。一个已知的问题是 XTickLabel 和 YTickLabels 不使用 LaTeX 解释器渲染,导致图形不好看。 (注意:我意识
我需要在一个公共(public)位置使用默认颜色和字体,以便在桌面应用程序的多个窗口窗体中使用它。 这方面的最佳做法是什么? 我正在考虑使用应用程序设置在那里定义它们,但我想确保这是推荐的方法或者是否
我是一名优秀的程序员,十分优秀!