python - 避免在 matplotlib + geopandas 中重叠标签-6ren

python - 避免在 matplotlib + geopandas 中重叠标签

转载作者：行者123 更新时间：2023-12-04 17:29:43

24

4

我找到了很多关于如何避免 matplotlib 上的文本重叠的例子，但没有一个是我能弄清楚如何应用到我的案例中的。

我有一个数据框 (mapadf1)，其中包含有关巴西市政当局的一些信息，并且我绘制了圣保罗州 (sp) 的 shapefile。

我创建了一个变量“l”，其中包含市政当局的名称和我要突出显示的数字。当数字为0时，字符串为空。

好的，所以我设法用以下代码绘制了我的 map :

# set the range for the choropleth values
vmin, vmax = 0, 1

# create figure and axes for Matplotlib
fig, ax = plt.subplots(1, figsize=(30, 10))

# remove the axis que mostra latitude e longitude
ax.axis('off')

# add a title and annotation
ax.set_title('Número leitos inaugurados: 22/03', fontdict={'fontsize': '25', 'fontweight' : '3'})
ax.annotate('Fonte: Governo do Estado de São Paulo', xy=(0.6, .05), xycoords='figure fraction', fontsize=12, color='#555555')

# empty array for the data range
sm.set_array([]) # or alternatively sm._A = []. Not sure why this step is necessary, but many recommends it

# create map
mapa_df1.plot(column='tem_leito',cmap='Paired', linewidth=0.8, ax=ax, edgecolor='0.8')

# Add Labels
mapa_df1['coords'] = mapa_df1['geometry'].apply(lambda x: x.representative_point().coords[:])
mapa_df1['coords'] = [coords[0] for coords in mapa_df1['coords']]

for idx, row in mapa_df1.iterrows():
    plt.annotate(s=row['l'], xy=row['coords'])

还有我的 map :

如何避免文字重叠？!

提前致谢!

最佳答案

实际上，由 plt.annotate 创建的对象call 是一个 matplotlib“注释” - 它有很多方法 - 和一个边界框，可以通过调用 .get_window_extent() 来检索它在返回的对象上。

如果您没有数以万计的点——无论如何这都不适合这种绘图，您可以将这些坐标存储在一个列表中——并在添加另一个对象时线性检查碰撞。 (对于几千个对象，这变得不可行，必须使用比线性策略更好的策略)。

现在还有一个问题:如果发生碰撞怎么办？更简单的解决方案就是不显示有问题的标签 - 但您可以尝试稍微重新定位新注释，使其不重叠。这样做可能很复杂 - 但如果我们选择一个简单的天真策略，比如说，只在 y 轴上移动元素直到它不再重叠，你可以获得一个相当稀疏的 map 的好结果，即使有一些错误。

“更聪明”的策略可以收集所有附近的标签，然后尝试以紧密的方式重新定位在一起 - 这需要几个小时甚至几天的工作。

因此，由于您没有我们可以在本地重现的数据示例，我将编写“在 y 轴上向下移动后面的注释直到它适合”策略。至少您会得到一个起点。

from matplotlib.transforms import Bbox

...

text_rectangles = []

y_step = 0.05

# This will have far better results if the labels are sorted descending in the y axis -
# 
mapa_df1["sort_key"] = [coord[1]  for coord in mapa_df1["coords"]]
mapa_df1.sort_values("sort_key", ascending=False, inplace=True)
del mapa_df1["sort_key"]

for idx, row in mapa_df1.iterrows():
    text = plt.annotate(s=row['l'], xy=row['coords'])

    rect = text.get_window_extent()

    for other_rect in text_rectangles():
        while bbox.intersection(rect, other_rect):  # overlapping
            x, y = text.get_position()
            text.set_position(x, y - y_step)
            rect = text.get_window_extent()
    text_rectangles.append(rect)

之后，您可以获取交互式创建的 Annotation 实例之一，并探索其方法和属性 - 然后甚至可以与 Pointer 进行交互，具体取决于渲染后端，例如，标签可以是以一定程度的透明度绘制，然后当鼠标指针悬停时变得完全不透明(例如，请参见 Possible to make labels appear when hovering over a point in matplotlib?)。

关于python - 避免在 matplotlib + geopandas 中重叠标签，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/60853205/

24

4

0

perl - 避免 Mojolicious 异步行为？避免 "AnyEvent::CondVar: recursive blocking wait attempted"
我们已经有一个使用 AnyEvent 的库。它在内部使用 AnyEvent，并最终返回一个值(同步 - 不使用回调)。有什么方法可以将这个库与 Mojolicious 一起使用吗？它的作用如下: #
JAXB 避免 JAXBElement
我想从 XSD 文件生成带有 JAXB 的 Java 类。问题是，我总是得到一些像这样的类(删除了命名空间): public static class Action { @X
javascript - 避免/禁用自动跳转到输入字段
我有一个关于 html 输入标签或 primefaces p:input 的问题。为什么光标总是自动跳转到输入字段。我的页面高度很高，因此您需要向下滚动。输入字段位于页面末尾，光标自动跳转(加载)到页
oop - 避免 if 语句
我今天在考虑面向对象设计，我想知道是否应该避免 if 语句。我的想法是，在任何需要 if 语句的情况下，您都可以简单地创建两个实现相同方法的对象。这两个方法实现只是原始 if 语句的两个可能的分支。
java - 避免 NullPointerException
String graphNameUsed = graphName.getName(); if (graphType.equals("All") || graphType.equals(
mysql - 避免/删除表中的重复行
我有一张友谊 table CREATE TABLE IF NOT EXISTS `friendList` ( `id` int(10) NOT NULL, `id_friend` int(10
c - 避免 if in 循环
上下文 Debian 64。Core 2 二人组。摆弄循环。我使用了同一循环的不同变体，但我希望尽可能避免条件分支。但是，即使我认为它也很难被击败。我考虑过 SSE 或位移位，但它仍然需要跳转(
java - 避免 OutOfMemoryError
我最近在 Java 中创建了一个方法来获取字符串的排列，但是当字符串太长时它会抛出这个错误:java.lang.OutOfMemoryError: Java heap space我确信该方法是有效的，
c++ - 避免 while (!is_eof)
我正在使用 (C++) 库，其中需要使用流初始化对象。库提供的示例代码使用此代码: // Declare the input stream HfstInputStream *in = NULL; tr
MySQL 避免 WHERE/AND 中的子查询重复
我有一个 SQL 查询，我在 WHERE 子句中使用子查询。然后我需要再次使用相同的子查询将其与不同的列进行比较。我假设没有办法在子查询之外访问“emp_education_list li”？我猜
android - 避免 NetworkOnMainThreadException
我了解到在 GUI 线程上不允许进行网络操作。对我来说还可以。但是为什么在 Dialog 按钮点击回调上使用这段代码仍然会产生 NetworkOnMainThreadException ？ new T
C++ 避免 if & 硬编码字符串
有没有办法避免在函数重定向中使用 if 和硬编码字符串，想法是接收一个字符串并调用适当的函数，可能使用模板/元编程.. #include #include void account() {
c - 避免 TIME_WAIT
我正在尝试避免客户端出现 TIME_WAIT。我连接然后设置 O_NONBLOCK 和 SO_REUSEADDR。我调用 read 直到它返回 0。当 read 返回 0 时，errno 也为 0。我
c++ - 避免/检测对导出文件的操纵
我正在开发 C++ Qt 应用程序。为了在应用程序或其连接的设备出现故障时帮助用户，程序导出所有内部设置并将它们存储在一个普通文件(目前为 csv)中。然后将此文件发送到公司(例如通过邮件)。为避免
java - 避免 instanceof
我有一组具有公共(public)父类(super class)的 POJO。这些存储在 superclass 类型的二维数组中。现在，我想从数组中获取一个对象并使用子类的方法。这意味着我必须将它们转
java - 避免 "for"语句中的空指针异常
在我的代码中，当 List 为 null 时，我通常使用这种方法来避免 for 语句中的 NullPointerException: if (myList != null && myList.size
c - 避免 TIME_WAIT
我正在尝试避免客户端出现 TIME_WAIT。我连接然后设置 O_NONBLOCK 和 SO_REUSEADDR。我调用 read 直到它返回 0。当 read 返回 0 时，errno 也为 0。我
c - 避免/减轻每次函数调用后返回值检查的痛苦的方法？
在不支持异常的语言和/或库中，许多/几乎所有函数都会返回一个值，指示其操作成功或失败 - 最著名的例子可能是 UN*X 系统调用，例如 open( ) 或 chdir()，或一些 libc 函数。无
R 按值选择，避免 NA
我尝试按值提取行。 col1 df$col1[col1 == "A"] [1] "A" NA 当然我只想要“A”。如何避免 R 选择 NA 值？顺便说一句，我认为这种行为非常危险，因为很多人都会陷入
R 避免 rowwise() 并寻找更快的替代方案
我想将两个向量合并到一个数据集中，并将其与函数 mutate 集成为 5 个新列到现有数据集中。这是我的示例代码: vector1% rowwise()%>% mutate(vector2|>

首页

博学

6Ren·AI

商城

python - 避免在 matplotlib + geopandas 中重叠标签