- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
这个问题与我上一个问题不同。我正在通过以下代码使用 facetgrid 打印直方图。
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib as mpl
import matplotlib.pyplot as plt
titanic = sns.load_dataset("titanic")
g= sns.FacetGrid(titanic, col ='survived', size = 3, aspect = 2)
g.map(plt.hist, 'age', color = 'r'), plt.show()
plt.show()
我让 seaborn 决定 bins 标签/值,这就是我想出的
我注意到条形图本身并没有一直延伸到标签。因此 0-10 标签中的第一个条形似乎一直延伸到 8 岁左右,而不是完全延伸到 10 岁。快速计算 value_count(除非我弄错了)表明第一个条形确实只包括 8 岁之前的事件.
然后我尝试通过以下代码更改要包含的垃圾箱数量:
g.map(plt.hist, 'age', bins =8, color = 'r'), plt.show()
最佳答案
因此,您在轴上看到的标签与 bin 的宽度关系不大。实际上,选择轴上的标签使得数据在相应的轴上可见。如果让 seaborn(实际上是 matplotlib)选择 bin 大小和数量,也会发生类似的事情。如果您指定 bin 编号,则选择 bin 的宽度,以使整个 x 范围的数据位于 bin 内。
如果你想控制 bin 的宽度,你需要为 bin 参数传递一个列表,而不仅仅是一个数字。假设您想要从 0 到 100 的 10 个分箱,您可以这样写:
g.map(plt.hist, 'age', bins=range(0, 110, 10)], color = 'r')
这会给你:
因此,bins
看起来像 [0, 10, ..., 100]
。
您可能不希望被如此硬编码,并希望有一些更灵活的方式来指定 bin。一种选择是定义 bin 宽度,并从数据的开始到结束都有 bin。这可能看起来像这样:
b_width = 10 # chose an arbitrary value here
my_bins = np.arange(min(titanic['age']), max(titanic['age']) + b_width, b_width)
g.map(plt.hist, 'age', bins=my_bins, color = 'r')
注意:np.arange
是我们使用 float 时需要的。如果您的数据仅为整数,您也可以为此使用 range
。
现在您可能还想调整 xticks
以便它们也显示 bin 开始。 Pyplot 对此有方便的命令:
plt.xticks(range(0, 110, 10))
或者对于后一个例子:
plt.xticks(np.around(my_bins, decimals=1))
可能需要 np.around
,因为您的数据可能从 float 开始,这在 x 轴刻度标签上看起来很难看。还要注意 plt.xticks
可以做更多方便的事情,所以你应该去 have a loock .
希望对您有所帮助!
关于python - Seaborn 直方图 bin 宽度未扩展到 bin 标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40473646/
bin、bin/、bin/*和bin/**有什么区别我的 .gitignore 文件?我一直在使用 bin/,但正在查看 other .gitignore files (在 eclipse file
给定 n 个无限容量的箱子,我想将 m 件元素装入其中(每个元素都有特定的重量),同时最小化最重箱子的重量。 这不是传统的垃圾箱包装/背包问题,其中垃圾箱的容量有限,而您试图尽量减少使用的垃圾箱数量;
Closed. This question is off-topic。它当前不接受答案。 想改善这个问题吗? Update the question,所以它是用于堆栈溢出的on-topic。 7年前关
我一直在寻找一个问题的解决方案,这个问题显然比我最初想象的更不寻常。 Optaplanner 看起来很有前途,但由于我对 Java 相对缺乏经验,所以我想在深入研究之前调查一下这是否完全不可能。 我正
我有一个琐碎的问题。我有一个非常大的 df 有很多列。我正在尝试找到最有效的方法来对具有不同 bin 大小的所有列进行 bin 并创建一个新的 df。这是一个仅对单个列进行分箱的示例: import
我想以这样的方式对数字列 (var) 进行分类,使每个分类中的行数大致相同。我的附加要求是该列中的一个(唯一)值不能分配给多个 bin。例如,如果 var 列中的值 1 分配给 bin 1,则不允许将
我在 centos (rhel 7)_ 上使用 make 命令和 gcc 7.1 通过代码进行编译,但遇到了以下错误: /bin/sh:/bin: 是一个目录 which sh 返回/usr/bin/
/usr/bin/ld: cannot find -ldlib /usr/bin/ld: cannot find -lcblas /usr/bin/ld: cannot find -llapack 在
我进行了一项眼动追踪实验,试图检测两个区域(感兴趣区域,名为“代理”和“患者”的 AOI)的注视分布。我将整个时间划分为时间段,例如得到以下列表: Stimulus Participant A
我正在尝试替换 whoami带有 ~/.local/bin/ 中的脚本的命令.有没有办法让我的 whoami 获得优先权,这样当我运行 whoami 时,我的脚本就会运行? 最佳答案 这就是我的 ~/
我的项目结构是这样的: . ├── Cargo.lock ├── Cargo.toml └── src ├── bin │ └── other.rs ├── main.rs
我正在开发一个小型图书馆应用程序,它以这种格式存储技术手册: 目前,我正在尝试将库的内容保存并根据用户的需要加载到 bin 文件中。 但是,当我尝试加载库文件时,唯一的变化是“-1”被打印到控制台。此
我试图忽略 Web 项目的 bin 文件夹,但包含该 bin 文件夹中的 .refresh 文件。 这是我的 .gitignore 中的内容: [Bb]in/ #Allow .refresh file
ipv6_hdr__f_next_header_cp: coverpoint this.ipv6_hdr.ipv6_f_next_header iff (this.has_ipv6_header){
今天有人给我发了一个以 #: 开头的脚本,谷歌搜索后我没有找到任何答案。 即使脚本有效,我想知道那是什么意思。 最佳答案 哇!这让我想起了很多记忆! 回到 1980 年代和 90 年代初期,有两种基本
我使用这个 ksh 函数将“1-Jan-2011”格式转换为“1.1.2011”。 #!/bin/ksh ##---- function to convert 3 char month into nu
我在 c# winform 项目中使用 sql-server compact 数据库。 如果我查看构成解决方案的文件,我可以在以下两个文件夹中看到 exe 和 sdf 文件的副本: /bin/Debu
这个问题与我上一个问题不同。我正在通过以下代码使用 facetgrid 打印直方图。 import numpy as np import pandas as pd import seaborn as
我有一个整数需要根据概率分布分成 bin。例如,如果我有 N=100 对象进入 [0.02, 0.08, 0.16, 0.29, 0.45] 那么你可能会得到 [1, 10, 20 , 25, 44]
我在寻找使用 Jenkins 运行 Appium 的脚本时阅读了以下脚本 #!/bin/bash --login killall -9 "iPhone Simulator" &> /dev/null
我是一名优秀的程序员,十分优秀!