- 使用 Spring Initializr 创建 Spring Boot 应用程序
- 在Spring Boot中配置Cassandra
- 在 Spring Boot 上配置 Tomcat 连接池
- 将Camel消息路由到嵌入WildFly的Artemis上
今天和大家一起学习一种可视化技术:构建树状热力图treemap。树形图易于可视化,且易于被人理解。树状图通过展示不同大小的矩形,以传达不同大小的数据量,一般认为,较大的矩形意味着占总体的一大部分,而较小的矩形意味着整体的一小部分。在本文中,云朵君将和大家一起学习如何使用Squarify库在 Python 中构建树形图。
树状图使用嵌套在一起的不同大小的矩形来可视化分层数据。每个矩形的大小与其代表的整体数据量成正比。这些嵌套的矩形代表树的分支,因此得名。除了尺寸外,每个矩形都有代表独特类别的独特颜色。树状图广泛用于从金融机构到销售组织的行业。
树形图最早是在 1990 年代早期由美国马里兰大学人机交互实验室的 Ben Shneiderman 教授发明的。这种可视化背后的想法是在固定空间中按大小比较数量。现在,我们将看看如何实际构建词云。
佛罗里达州的树状图 来源:https://commons.wikimedia.org
Python 中的,可以使用 Squarify 直接构建树状图。且只需要一行代码squarify.plot(data)
即可轻松构建。
!pip install squarify
import matplotlib.pyplot as plt
import squarify
随机生成一个值列表,这些值将作为数据传递到我们的绘图中。
data = [500, 250, 60, 120]
使用**squarify.plot()
** 方法构建树状图。这里将随机数据变量data作为此 squarify.plot
方法的参数。此外,附加一行修饰代码 plt.axis('off')
隐藏 树状图 的轴。
squarify.plot(data)
plt.axis('off')
plt.show()
import matplotlib.pyplot as plt
import squarify
data = [500, 250, 60, 120]
squarify.plot(data)
plt.axis('off')
plt.show()
在执行此代码时,我们得到:
每次执行此代码时,它都生成一组随机颜色的嵌套矩形。
借助 .plot()
方法的参数,可以在树状图中添加更多的修饰。可以通过明确指定属性来控制树形图的颜色、标签和填充。
import matplotlib.pyplot as plt
import squarify
sizes = [500, 250, 120, 60]
color = ['red', 'green', 'blue', 'orange']
squarify.plot(sizes,color=color)
plt.axis('off')
plt.show()
在执行此代码时,我们得到:
不同的标签值可以通过将列表传递到 squarify.plot()
的标签属性来显式添加标签。这将覆盖现有标签或将标签添加到我们的树状图中(如果不存在)。标签将按照.plot()
所传递的列表中的相同顺序被添加到树状图中。
import matplotlib.pyplot as plt
import squarify
labels = ['A', 'AB', 'ABC', 'ABCD']
sizes = [500, 250, 120, 60]
color = ['red', 'green', 'blue', 'orange']
squarify.plot(sizes,color=color, label = labels)
plt.axis('off')
plt.show()
在执行此代码时,我们得到:
可以在树状图中添加pad
,将树状图中的每个具体彼此分离,这将有助于更好地区分矩形。当有大量类别或矩形时,这很有用。可以通过将pad参数设置为True来调用。
import matplotlib.pyplot as plt
import squarify
labels = ['AB', 'A', 'ABC', 'ABCD']
sizes = [500, 250, 120, 60]
color = ['red', 'green', 'blue', 'orange']
squarify.plot(sizes,color=color, label = labels, pad = True)
plt.axis('off')
plt.show()
在执行代码时,我们得到:
由此看来,构建树形图可谓是小菜一碟。除了squarify 库,树状图还可以使用 Python 中的其他几个库来构建。如比较流行的plotly库。
在今天的次条推文中介绍了其应用案例,感兴趣的小伙伴可以看看。
import plotly_express as px
import plotly.graph_objects as go
px.treemap(names = name, parents = parent)
go.Figure(go.Treemap(labels = name, parents = parent,))
当然,还有许多 BI 工具可用于更加方便简单地构建树状图。
有时,树状图中可能会出现歧义。如果有多个具有相同数量(或矩形大小)和相同颜色深浅的类别,则导致用户最终很难区分它们。所以在构建树状图时,必须始终考虑所涉及的类别数量和颜色映射。
- END -
对比Excel系列图书累积销量达15w册,让你轻松掌握数据分析技能,可以在全网搜索书名进行了解选购:
我正在处理一组标记为 160 个组的 173k 点。我想通过合并最接近的(到 9 或 10 个组)来减少组/集群的数量。我搜索过 sklearn 或类似的库,但没有成功。 我猜它只是通过 knn 聚类
我有一个扁平数字列表,这些数字逻辑上以 3 为一组,其中每个三元组是 (number, __ignored, flag[0 or 1]),例如: [7,56,1, 8,0,0, 2,0,0, 6,1,
我正在使用 pipenv 来管理我的包。我想编写一个 python 脚本来调用另一个使用不同虚拟环境(VE)的 python 脚本。 如何运行使用 VE1 的 python 脚本 1 并调用另一个 p
假设我有一个文件 script.py 位于 path = "foo/bar/script.py"。我正在寻找一种在 Python 中通过函数 execute_script() 从我的主要 Python
这听起来像是谜语或笑话,但实际上我还没有找到这个问题的答案。 问题到底是什么? 我想运行 2 个脚本。在第一个脚本中,我调用另一个脚本,但我希望它们继续并行,而不是在两个单独的线程中。主要是我不希望第
我有一个带有 python 2.5.5 的软件。我想发送一个命令,该命令将在 python 2.7.5 中启动一个脚本,然后继续执行该脚本。 我试过用 #!python2.7.5 和http://re
我在 python 命令行(使用 python 2.7)中,并尝试运行 Python 脚本。我的操作系统是 Windows 7。我已将我的目录设置为包含我所有脚本的文件夹,使用: os.chdir("
剧透:部分解决(见最后)。 以下是使用 Python 嵌入的代码示例: #include int main(int argc, char** argv) { Py_SetPythonHome
假设我有以下列表,对应于及时的股票价格: prices = [1, 3, 7, 10, 9, 8, 5, 3, 6, 8, 12, 9, 6, 10, 13, 8, 4, 11] 我想确定以下总体上最
所以我试图在选择某个单选按钮时更改此框架的背景。 我的框架位于一个类中,并且单选按钮的功能位于该类之外。 (这样我就可以在所有其他框架上调用它们。) 问题是每当我选择单选按钮时都会出现以下错误: co
我正在尝试将字符串与 python 中的正则表达式进行比较,如下所示, #!/usr/bin/env python3 import re str1 = "Expecting property name
考虑以下原型(prototype) Boost.Python 模块,该模块从单独的 C++ 头文件中引入类“D”。 /* file: a/b.cpp */ BOOST_PYTHON_MODULE(c)
如何编写一个程序来“识别函数调用的行号?” python 检查模块提供了定位行号的选项,但是, def di(): return inspect.currentframe().f_back.f_l
我已经使用 macports 安装了 Python 2.7,并且由于我的 $PATH 变量,这就是我输入 $ python 时得到的变量。然而,virtualenv 默认使用 Python 2.6,除
我只想问如何加快 python 上的 re.search 速度。 我有一个很长的字符串行,长度为 176861(即带有一些符号的字母数字字符),我使用此函数测试了该行以进行研究: def getExe
list1= [u'%app%%General%%Council%', u'%people%', u'%people%%Regional%%Council%%Mandate%', u'%ppp%%Ge
这个问题在这里已经有了答案: Is it Pythonic to use list comprehensions for just side effects? (7 个答案) 关闭 4 个月前。 告
我想用 Python 将两个列表组合成一个列表,方法如下: a = [1,1,1,2,2,2,3,3,3,3] b= ["Sun", "is", "bright", "June","and" ,"Ju
我正在运行带有最新 Boost 发行版 (1.55.0) 的 Mac OS X 10.8.4 (Darwin 12.4.0)。我正在按照说明 here构建包含在我的发行版中的教程 Boost-Pyth
学习 Python,我正在尝试制作一个没有任何第 3 方库的网络抓取工具,这样过程对我来说并没有简化,而且我知道我在做什么。我浏览了一些在线资源,但所有这些都让我对某些事情感到困惑。 html 看起来
我是一名优秀的程序员,十分优秀!