python - 具有交叉分支的桑基图-6ren

python - 具有交叉分支的桑基图

转载作者：太空宇宙更新时间：2023-11-03 12:06:21

30

4

我想编写一个部分圆形的 Sankey 图，其中一些分支必须与其他分支交叉。

像这样的东西(编辑:更好的例子，一个图的分支实际上交叉并重新连接): sample sankey diagram .

我熟悉 matplotlib，但从未尝试过它的 Sankey module ;它在演示中没有显示任何交叉点，所以我想知道它是否真的受支持。如果是这样，有人可以展示如何做吗？

关于能够生成此类图的其他(最好是非交互式)工具的提示也很受欢迎(我知道 TikZ 可以做到这一点，如图 here -- 这是我的第二个选项)。

最佳答案

好问题，我也无法让 matplotlib Sankey 创建具有多对多关系的图表。作为解决方法，我创建了一个看起来像 Sankey 的线图:

import matplotlib.pyplot as plt
import pandas as pd
import random
# prepare example data: flow of students from zipcodes to schools
flows = [('2251', 'school A', 7), ('2251', 'school B', 6), ('2252', 'school A', 3), ('2252', 'school B', 8), ('2253', 'school B', 1), ('2252', 'school C', 12), ('2253', 'school A', 8), ('2252', 'school D', 16)]
df_flows = pd.DataFrame(flows, columns=['zipcode', 'school', 'students'])
df_flows['color'] = ["#"+''.join([random.choice('0123456789ABCDEF') for j in range(6)]) for i in range(len(df_flows))]

# sort by zipcode to get the right y position per school
df_flows.sort_values(['zipcode','school'], ascending=False, inplace=True)
ypos_0 = 0
current = df_flows.iloc[0]['zipcode']
whitespace = 2
for i,r in df_flows.iterrows(): # I tried with .shift() and .cumsum() but failed
    zipcode = r['zipcode']
    if current != zipcode:
        ypos_0 += + whitespace
        current = zipcode
    df_flows.at[i,'y_pos_zipcode_0'] = ypos_0
    df_flows.at[i,'y_pos_zipcode_1'] = ypos_0 + r['students']
    ypos_0 += r['students'] 

# sort by school to get the right y position per school
df_flows.sort_values(['school','zipcode'], ascending=False, inplace=True)
ypos_0 = 0
current = df_flows.iloc[0]['school']
for i,r in df_flows.iterrows(): # I tried with .shift() and .cumsum() but failed
    school = r['school']
    if current != school:
        ypos_0 += + whitespace
        current = school
    df_flows.at[i,'y_pos_school_0'] = ypos_0
    df_flows.at[i,'y_pos_school_1'] = ypos_0 + r['students']
    ypos_0 += r['students'] 

# y position of the labels: in the middle
s = df_flows.groupby('school')['y_pos_school_0'].min()
df_flows['y_pos_label_school_min'] = df_flows['school'].map(s)
s = df_flows.groupby('school')['y_pos_school_1'].max()
df_flows['y_pos_label_school_max'] = df_flows['school'].map(s)
df_flows['y_pos_label_school'] = (df_flows['y_pos_label_school_max'] + df_flows['y_pos_label_school_min']) / 2

s = df_flows.groupby('zipcode')['y_pos_zipcode_0'].min()
df_flows['y_pos_label_zipcode_min'] = df_flows['zipcode'].map(s)
s = df_flows.groupby('zipcode')['y_pos_zipcode_1'].max()
df_flows['y_pos_label_zipcode_max'] = df_flows['zipcode'].map(s)
df_flows['y_pos_label_zipcode'] = (df_flows['y_pos_label_zipcode_max'] + df_flows['y_pos_label_zipcode_min']) / 2

# determine x and y positions for the annotations
xval = 1/(len(df_flows)+1)
df_flows['x_pos_annotation'] = [xval*_ for _ in range(1,len(df_flows)+1)]
df_flows['y_pos_min'] = df_flows[['y_pos_zipcode_0','y_pos_school_0']].min(axis=1)
df_flows['y_pos_max'] = df_flows[['y_pos_zipcode_1','y_pos_school_1']].max(axis=1)
df_flows['y_pos_mid'] = (df_flows['y_pos_min'] + df_flows['y_pos_max']) / 2
df_flows['y_pos_delta'] = df_flows['y_pos_max'] - df_flows['y_pos_min']

df_flows['y_pos_direction'] = df_flows['y_pos_zipcode_0'] - df_flows['y_pos_school_0']
df_flows['y_pos_direction'] = df_flows['y_pos_direction'].apply(lambda x: -1 if x>0 else 1)

# the position is lower or higher than the middle -> the adjustment is proportional of the number of students
df_flows['x_pos_adjust'] = df_flows['x_pos_annotation'] - 0.5
df_flows['x_pos_adjust_abs'] = df_flows['x_pos_adjust'].apply(lambda x:abs(x))
df_flows['y_pos_adjust'] = df_flows['x_pos_adjust'] * df_flows['y_pos_direction'] * df_flows['y_pos_delta']
df_flows['y_pos_annotation'] = df_flows['y_pos_adjust'] + df_flows['y_pos_mid'] - (df_flows['students']*df_flows['x_pos_adjust_abs'])
# create sub df as basis for arrays to set axis labels
df_zipcode_ticks = df_flows[['zipcode','y_pos_label_zipcode']].drop_duplicates(keep='first')
df_school_ticks = df_flows[['school','y_pos_label_school']].drop_duplicates(keep='first')

# create the sankey like linechart using fill_between
fig = plt.figure()
ax = fig.add_subplot(1, 1, 1, title="Connected sankey diagram using a matplotlib lineplot")
for index, flow in df_flows.iterrows():
    _ = plt.plot([0,1],[flow['y_pos_zipcode_0'],flow['y_pos_school_0']],color=flow['color'], alpha=0.3)
    _ = plt.plot([0,1],[flow['y_pos_zipcode_1'],flow['y_pos_school_1']],color=flow['color'], alpha=0.3)
    plt.fill_between([0,1],[flow['y_pos_zipcode_0'],flow['y_pos_school_0']],[flow['y_pos_zipcode_1'],flow['y_pos_school_1']],color=flow['color'], alpha=0.3)
    ax.annotate(f"{flow['students']}", xy=(flow['x_pos_annotation'],flow['y_pos_annotation']), xycoords='data')
ax.set_xticks([])
ax.set_yticks(df_zipcode_ticks['y_pos_label_zipcode'].values)
ax.set_yticklabels(df_zipcode_ticks['zipcode'].values)

ymin = df_flows['y_pos_school_0'].min()
ymax = df_flows['y_pos_school_1'].max()
ax.set_xlim([0,1])
ax.set_ylim([ymin,ymax])

# new ax object to create a 2nd y-axis based on a shared x-axis
ax2 = ax.twinx()
ax2.set_yticks(df_school_ticks['y_pos_label_school'])
ax2.set_yticklabels(df_school_ticks['school'])
ax2.set_ylim([ymin,ymax])
plt.show()

关于python - 具有交叉分支的桑基图，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/30874708/

30

4

0

文章推荐： java - 解析 JSON 数据时出现 ArrayIndexOutOfBoundsException 错误

文章推荐： c# - 球体对撞机碰撞射击玩家船？

git - 使用 GIT 分支/分支
我使用 Git 有一段时间了，但尽管在博客和教程上花了很多时间，但我仍然无法理解某些功能...:) 我正在与其他人合作一个项目，我的老板为此在 bitBucket 上创建了一个存储库。我在本地克隆了
git diff 仅显示修订版/分支 A 领先于修订版/分支 B
有时我会遇到以下问题: 在功能分支中添加一些提交。从上游更新 master。想要查看功能分支和 master 之间的差异，但是 git diff master 显示了在 master 中添加/删除
git - 如何将 Gerrit 分支 merge 到另一个 Gerrit 分支
我使用的是 Gerrit 2.4.2 版。我有一个分支 master，我创建了一个名为 newbranch 的新分支。然后我将一些更改推送到远程(Gerrit 的)newbranch。在 Gerrit
git - 从 origin/master 分支 vs 从本地 master 分支
假设我们有一个远程存储库并在本地克隆它。我们 checkout master 分支，所以现在我们有本地 master 和一个 Remote remotes/origin/master . 然后我必须
git - 将 CocoaPods 分支 merge 为 Carthage 分支 - 怎么做？
我有一个项目，其中开发分支使用 CocoaPods，但其中一位开发人员决定删除它并改用 Carthage。 feature 分支使用的是 CocoaPods，因为它是在 develop 分支转换之前一
git - "debug"分支， merge 没有 "fix"的 "debug"分支
我有一个有问题的 master 分支需要调试。为此，我想插入一堆调试程序(例如，打印变量)，查明错误并应用修复程序。稍后，我想将修复 merge 到 master 分支中，但我不想跳过调试更改。 #
git - 将 bug 修复补丁从 release 分支 merge 到 master 分支
我有一个 master 分支，我正在其中 push 我的最新开发。现在在某个时候，我确实从 master 分支发布并创建了名为 release1 的新分支。现在我在master分支上做新的开发与
python - 如何使用 GitPython 将 master 分支 merge 到 feature 分支？
我正在尝试使我的一些标准工作流程自动化，我发现自己经常做的一件事是将对远程 master 分支的更改 merge 到我自己的本地分支并推送结果。所以步骤如下: 转为大师从远程 pull 更改切换
git/gerrit 防止 develop 分支 merge 到 stable/testing 分支
使用 Gerrit 很容易意外地将开发分支中的不稳定代码 merge 到稳定分支中: $ git checkout develop $ commit $ git push origin HEAD:re
Github 分支
我有一个正在进行的项目，我正在雇用承包商来帮助我处理代码的某些部分。问题是我不想让任何一个承包商看到所有这些。我可以在 GitHub 上为他们分配私有(private)存储库下的分支吗？这需要命令行
12、SVN 分支
SVN 分支 Branch 选项会给开发者创建出另外一条线路。当有人希望开发进程分开成两条不同的线路时，这个选项会非常有用。我们先假设你已经发布了一个产品的 1.0 版本，你可能想创建一个新的分支，
分支 hell ，风险与生产力的临界点在哪里？
关闭。这个问题是opinion-based .它目前不接受答案。想改进这个问题？更新问题，以便 editing this post 提供事实和引用来回答它. 2年前关闭。 Improve this
从特定修订版创建 svn 分支
有没有办法从特定的修订版中创建(svn)分支，因为我想跳过提交历史中的一些修订(在新分支中)。例如，我有从 1 到 1590 的修订，我想创建一个新分支并跳过提交(从 1504 到 1574 )和
svn - 用于颠覆复制的简洁命令行(分支)
到目前为止我看到的所有 svn 分支的例子都是这样的 svn cp -m 'Making test branch' svn://svnrepo/hellosite svn://svnrepo/hell
服务器上不存在 Sonarqube 分支
当我尝试使用 Sonar 扫描仪分析我的项目时，扫描失败并显示以下错误消息: Caused by: Branch does not exist on server: develop 显然，这只发生在它
名称为空的 Mercurial 分支
在我的 Mercurial 存储库中，不知何故，有人输入了空白分支名称: 如果我hg id -r 2004，我确实得到空白文本。现在的问题是，这会导致我们的Redmine安装出现问题，因为它无法同步存
haskell - 如何在Haskell中编写常见的 "if"分支
我有以下代码片段: srcaddr >= inet_ntoa . fromJust dstaddr >= inet_ntoa . fromJust -- I want to perform actio
集市绑定(bind)分支
在我的项目中，我有用于工作的本地分支和网络驱动器上的分支我在本地一号和网络一号之间做了“绑定(bind)分支”我的想法是使用绑定(bind)选项自动备份每个本地提交。我在本地分支提交文件后，我在网络
mysql - 使用不同的脚本创建 If 分支
我想创建一个脚本，根据变量的状态使用不同的表和命令执行不同的操作。在 T-SQL 中，我会这样做: DECLARE @whatToDo INT = 1; IF @whatToDo = 1 BEGIN
C 编程问题 - 分支
Write a program that reads input up to # and reports the number of times that the sequence ei occurs

首页

博学

6Ren·AI

商城

python - 具有交叉分支的桑基图