python - Plotly:如何绘制具有跨不同列的匹配行的 Sankey 图？-6ren

python - Plotly:如何绘制具有跨不同列的匹配行的 Sankey 图？

转载作者：行者123 更新时间：2023-12-04 04:02:19

31

4

我正在通过 plotly 绘制桑基图来比较不同的观察分类。但是，我对两个以上的分类有一些问题，其中每个分类中的观察顺序在每个节点的输入和输出之间发生变化。

我使用的代码如下:

def pl_sankey(df, label_color, categories, value, title='Sankey Diagram', fname=None, width=3000, height=1600, scale=2):
    from IPython.display import Image
    import plotly.graph_objects as go
    import pandas as pd
    df = df.copy()
    labels = []
    colors = []
    # associate labels to colors
    for k, v in label_color.items():
        labels += [k]
        colors += [v]
    # transform df into a source-target pair
    st_df = None
    for i in range(len(categories)-1):
        _st_df = df[[categories[i],categories[i+1],value]]
        _st_df.columns = ['source', 'target', 'count']
        st_df = pd.concat([st_df, _st_df])
        st_df = st_df.groupby(['source', 'target']).agg({'count': 'sum'}).reset_index()
    # add index for source-target pair
    st_df['sourceID'] = st_df['source'].apply(lambda x: labels.index(str(x)))
    st_df['targetID'] = st_df['target'].apply(lambda x: labels.index(str(x)))
    # creating the sankey diagram
    data = dict(
        type='sankey', node=dict(
            pad=15, thickness=20, line = dict(color='black', width=0.5), label=labels, color=colors,
        ),
        link=dict(source=st_df['sourceID'], target=st_df['targetID'], value=st_df['count']),
    )
    layout = dict(title=title, font=dict(size=16, family='Arial'))  
    # creating figure
    fig = go.Figure(dict(data=[data], layout=layout))
    if fname:
        fig.write_image(f'{fname}.pdf', format='pdf', width=width, height=height, scale=scale)
    return Image(fig.to_image(format='png', width=width, height=height, scale=scale))

输入参数为:

一个 pandas DataFrame df，每组行都有分组，例如:

# g1_l1 means group1, label1

       g1      g2      g3   counts
0   g1_l1   g2_l1   g3_l1   10
1   g1_l3   g2_l2   g3_l1   1
2   g1_l1   g2_l2   g3_l2   1
3   g1_l2   g2_l2   g3_l1   40
4   g1_l2   g2_l3   g3_l2   20
5   g1_l3   g2_l1   g3_l2   10

label_color 是一个字典，其中键是标签，值是颜色
categories 是分组的列名，在本例中为 ['grouping1', 'grouping2', 'grouping3']
values 是计数的列名，在本例中为 'counts'

一个执行示例如下:

df = pd.DataFrame([
    ['g1_l1', 'g2_l1', 'g3_l1', 10],
    ['g1_l3', 'g2_l2', 'g3_l1', 1],
    ['g1_l1', 'g2_l2', 'g3_l2', 1],
    ['g1_l2', 'g2_l2', 'g3_l1', 40],
    ['g1_l2', 'g2_l3', 'g3_l2', 20],
    ['g1_l3', 'g2_l1', 'g3_l2', 10],
], columns=['g1', 'g2', 'g3', 'counts'])

label_color = {
    'g1_l1': '#1f77b4', 'g1_l2': '#ff7f0e', 'g1_l3': '#279e68',
    'g2_l1': '#1f77b4', 'g2_l2': '#ff7f0e', 'g2_l3': '#279e68',
    'g3_l1': '#1f77b4', 'g3_l2': '#ff7f0e',
}

pl_sankey(df, label_color, categories=df.columns[:-1], value='counts', title='', fname=None)

但是，此代码保证仅在两个相邻列之间进行行匹配。例如，考虑第 1 行:

       g1      g2      g3   counts
1   g1_l3   g2_l2   g3_l1   1

这样的行应该从第一列的绿色簇 (g1_l3) 开始，落在第二列的橙色簇 (g2_l2) 并继续到蓝色簇 ( g3_l1) 第三列。然而，这在之前的图中并没有得到尊重，其中第二列的输入与匹配输出的排序不同。

附上注释图以显示第二列观察的跳跃(这种观察在输入中倒数第二，但在第二列输出中倒数第二):

我想沿着从第一列到最后一列的行路径。这可能吗？如何使用 Sankey 图实现？

最佳答案

我可能完全误解了这里的某些内容，但我希望能以正确的方式指导您。因此，如果我错了，请原谅我，但您似乎误解了 plotly sankey 图的一些内部工作原理。别担心，你是not alone .

你是说:

Such row should start from green cluster (g1_l3) on first column, landin orange cluster (g2_l2) in second column and continue to bluecluster (g3_l1) on third column

因此，如果我没理解错的话，您希望这种特殊关系被说明为:

但这并不是一个 plotly sankey 图的工作方式。相反，从 g1_l3 到 g2_l2 的数量与进入 g2_l2 的其他数量组合在一起，然后作为聚合值“发送”到 g3_l1。你有这条线的原因:

... 是因为您还有关系 g2_l2 , g3_l1, 1:

如果您以某种方式成功地说明了数据框中的关系，完全您在桑基图中的描述方式，它就不再是桑基图了。

很抱歉，这就是我目前能为您做的所有事情。

关于python - Plotly:如何绘制具有跨不同列的匹配行的 Sankey 图？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/62902499/

31

4

0

文章推荐： postgresql - Amazon RDS 实例类型 (PostgreSQL) 之间的实际差异

文章推荐： python - 如何绘制具有不同范围的多列的箱线图

文章推荐： python - 重采样 Pandas 中的 boolean 值

plotly - plotly 标签
我想更改 plotly(_express) 图中的构面标签。剧情如下: import plotly.express as px tips = px.data.tips() fig = px.scatt
plotly - Plotly 中所有地理范围的列表
我正在尝试使用 plotly.js 在 map 上绘制数据。我知道您可以通过以下方式获得一个国家/地区的 map : layout = dict( title = '',
plotly - Plotly 的默认色标是什么？
关于 this page暗示他们有一些默认的色标，例如“Viridis”。我终其一生都找不到一个网页来记录这些命名的色标是什么。最佳答案问题是我是英国人并且正确拼写了颜色。色标可在 https:/
r - 如何在 plotly 中为子 plotly 中的所有 plotly 强制使用相同的颜色？
在下面的示例中，我在一个 plotly 子图中有四个箱形图。此示例中的四个箱形图中的每一个都有 3 个变量:股票、债券和现金。在每个箱线图中，我希望股票以相同的颜色(例如蓝色)显示，债券以相同的颜色(
javascript - plotly:删除 plot 并在同一个 div 中创建一个新的 plot
我有一个 plotly plot，当数据发生变化时，我想删除 plot 并生成一个新 plot。为此，我这样做: $('#heatmap2').empty() 然后我重新生成我的 plotly 。但是
python - Plotly:如何使用 plotly.graph_objects 和 plotly.express 在图形中定义颜色？
有许多问题和答案以一种或另一种方式涉及这个主题。有了这个贡献，我想清楚地说明为什么一个简单的方法，比如 marker = {'color' : 'red'}将适用于 plotly.graph_obje
python - 为什么 matplotlib .plot(kind ='bar' ) plot 与 .plot() 如此不同
这可能是一个非常愚蠢的问题，但是当使用 .plot() 绘制 Pandas DataFrame 时，它非常快并且会生成具有适当索引的图形。一旦我尝试将其更改为条形图，它似乎就失去了所有格式并且索引
python - plotly dash - 使用 plotly 生成图像，在本地保护它并使用 plotly dash 显示它
我用 plotly (express) 生成了很多图像，并将它们以 png 格式保存在本地目录中。我想创建一个带有 plotly dash 的仪表板。我生成的图像有很多依赖关系:这就是我不想将代码包含
python - 交互式 plotly 的 plotly 表达与Altair/Vega-Lite的 plotly 比较
最近，我正在学习Plotly express和Altair/Vega-Lite进行交互式绘图。他们两个都令人印象深刻，我想知道他们的优点和缺点是什么。尤其是对于创建交互式地块，它们之间有什么大差异，何
plotly:从直方图中获取值/plotly:从轨迹中获取值
在 plotly 中，我可以创建一个直方图，例如in this example code from the documentation : import plotly.express as px df
plot - Julia plot 函数数组问题
来自 Matlab 我正在努力弄清楚为什么以下不起作用: plot(x=rand(10),y=rand(10)) 正确生成图表。 x=rand(10) y=rand(10) plot(x,y) 产生错
plot - 自定义图例标签 - geopandas.plot()
我和一位同事一直在尝试设置自定义图例标签，但到目前为止都失败了。下面的代码和详细信息 - 非常感谢任何想法! 笔记本:toy example uploaded here 目标:将图例中使用的默认比率值
plotly - 如何使用 Plotly 控制哪些跟踪图位于顶部？
我正在使用 Plotly python 库生成一个带有几个 fiddle 图和几个填充散点图的图形。无论什么订单我都有个人fig.add_trace在我的代码中调用， fiddle 图总是在散点图后面
plot - 删除 Plotly 中图表之间的差距
我将图表的大小配置为 Shiny 但图表之间仍有空白区域它们在配置高度和宽度之前显示为旧区域这是我的代码 plot1_reactive % layout(xaxis = xaxis,
plotly - 如何组织一个有 plotly 的破折号项目？
我想弄清楚如何组织一个包含多个应用程序的破折号项目。所有示例都是单页应用程序，我希望将多个破折号组织为一个项目，由 gunicorn 运行(在 docker 容器内): dash-project/
Julia Plotly 不显示带有子图的 plotly
我之前做了一些解决方法来在 Julia Plotly 中实现精彩的子图，但目前正在努力解决一个更复杂的问题。下面有三种方法可以完成这项工作。 draw1 完美地完成了，但不适用于我的情况，draw2
plotly - 删除 Plotly 中子图之间的空间？
我的子图之间有很大的空间。在 matplotlib 中，有一种称为紧密布局的布局可以消除这种情况。 plotly 有没有类似的布局？我正在 iPython 笔记本中绘图，因此空间有限。请参阅下图中的空
plotly - plot.ly 热图色标不起作用
我正在尝试获取我提前生成的 cbrewer Reds 颜色图。但是，当我尝试使用它时，我仍然得到一些默认的颜色图。我究竟做错了什么？这是 plotly :https://plot.ly/~smirno
plotly - Plot.ly - 图例中同一键的多条轨迹
我一直在使用 plot.ly 并希望将多个跟踪分组到图例中的同一个键。我有显示有关特定用户的数据的子图。我想让每个键代表一个用户，而不是 user.data1、user.data2 等。这是我现在
plot - 如何从 Plotly 中删除轴和数字
我有下面这张图，我想把除点和三角形以外的所有东西都去掉，意思是横纵轴上的数字和小竖线，我该怎么做？这是图片: 这是我的代码: x0 = np.average(triangleEdges,axis=0

首页

博学

6Ren·AI

商城

python - Plotly:如何绘制具有跨不同列的匹配行的 Sankey 图？