- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有这种格式的数据。我可以从中得到条形图,但不能得到散点图,因为 x 轴有字符串。我查看了其他几篇文章,但无法收集到太多信息。
import pandas as pd
import numpy as np
df = pd.DataFrame({"id":["ssa", "ssb", "ssc", "xxa", "xxb", "xxc"], "mean":[1.3,1.5,5.2,3.1,2.1,3.2], "sd":[0.9,0.5,0.3,0.1,0.2,0.3]})
df
我使用以下命令获得带有误差线的条形图:
import matplotlib.pyplot as plt
ax = plt.figure()
ax = df.plot(kind='bar',x='id', y='mean',figsize=[15,6], yerr='sd')
ax.set_xlabel("id")
ax.set_ylabel("mean")
ax = plt.tight_layout()
ax = plt.show()
但是当我尝试绘制相同 df 的散点图时出现错误。
ax = plt.figure()
ax = df.plot(kind='scatter',x='id', y='mean',figsize=[15,6], yerr='sd')
ax.set_xlabel("id")
ax.set_ylabel("mean")
ax = plt.tight_layout()
ax = plt.show()
错误回溯:
---------------------------------------------------------------------------
KeyError Traceback (most recent call last)
<ipython-input-10-b3ab7237d4f1> in <module>()
1 ax = plt.figure()
----> 2 ax = df.plot(kind='scatter',x='id', y='mean',figsize=[15,6], yerr='sd', style='.')
3 ax.set_xlabel("id")
4 ax.set_ylabel("mean")
5 ax = plt.tight_layout()
C:\Users\AppData\Local\Continuum\Anaconda2\lib\site-packages\pandas\plotting\_core.pyc in __call__(self, x, y, kind, ax, subplots, sharex, sharey, layout, figsize, use_index, title, grid, legend, style, logx, logy, loglog, xticks, yticks, xlim, ylim, rot, fontsize, colormap, table, yerr, xerr, secondary_y, sort_columns, **kwds)
2618 fontsize=fontsize, colormap=colormap, table=table,
2619 yerr=yerr, xerr=xerr, secondary_y=secondary_y,
-> 2620 sort_columns=sort_columns, **kwds)
2621 __call__.__doc__ = plot_frame.__doc__
2622
C:\Users\AppData\Local\Continuum\Anaconda2\lib\site-packages\pandas\plotting\_core.pyc in plot_frame(data, x, y, kind, ax, subplots, sharex, sharey, layout, figsize, use_index, title, grid, legend, style, logx, logy, loglog, xticks, yticks, xlim, ylim, rot, fontsize, colormap, table, yerr, xerr, secondary_y, sort_columns, **kwds)
1855 yerr=yerr, xerr=xerr,
1856 secondary_y=secondary_y, sort_columns=sort_columns,
-> 1857 **kwds)
1858
1859
C:\Users\AppData\Local\Continuum\Anaconda2\lib\site-packages\pandas\plotting\_core.pyc in _plot(data, x, y, subplots, ax, kind, **kwds)
1680 plot_obj = klass(data, subplots=subplots, ax=ax, kind=kind, **kwds)
1681
-> 1682 plot_obj.generate()
1683 plot_obj.draw()
1684 return plot_obj.result
C:\Users\AppData\Local\Continuum\Anaconda2\lib\site-packages\pandas\plotting\_core.pyc in generate(self)
236 self._compute_plot_data()
237 self._setup_subplots()
--> 238 self._make_plot()
239 self._add_table()
240 self._make_legend()
C:\Users\AppData\Local\Continuum\Anaconda2\lib\site-packages\pandas\plotting\_core.pyc in _make_plot(self)
829 else:
830 label = None
--> 831 scatter = ax.scatter(data[x].values, data[y].values, c=c_values,
832 label=label, cmap=cmap, **self.kwds)
833 if cb:
C:\Users\AppData\Local\Continuum\Anaconda2\lib\site-packages\pandas\core\frame.pyc in __getitem__(self, key)
2060 return self._getitem_multilevel(key)
2061 else:
-> 2062 return self._getitem_column(key)
2063
2064 def _getitem_column(self, key):
C:\Users\AppData\Local\Continuum\Anaconda2\lib\site-packages\pandas\core\frame.pyc in _getitem_column(self, key)
2067 # get column
2068 if self.columns.is_unique:
-> 2069 return self._get_item_cache(key)
2070
2071 # duplicate columns & possible reduce dimensionality
C:\Users\AppData\Local\Continuum\Anaconda2\lib\site-packages\pandas\core\generic.pyc in _get_item_cache(self, item)
1532 res = cache.get(item)
1533 if res is None:
-> 1534 values = self._data.get(item)
1535 res = self._box_item_values(item, values)
1536 cache[item] = res
C:\Users\AppData\Local\Continuum\Anaconda2\lib\site-packages\pandas\core\internals.pyc in get(self, item, fastpath)
3588
3589 if not isnull(item):
-> 3590 loc = self.items.get_loc(item)
3591 else:
3592 indexer = np.arange(len(self.items))[isnull(self.items)]
C:\Users\AppData\Local\Continuum\Anaconda2\lib\site-packages\pandas\core\indexes\base.pyc in get_loc(self, key, method, tolerance)
2393 return self._engine.get_loc(key)
2394 except KeyError:
-> 2395 return self._engine.get_loc(self._maybe_cast_indexer(key))
2396
2397 indexer = self.get_indexer([key], method=method, tolerance=tolerance)
pandas\_libs\index.pyx in pandas._libs.index.IndexEngine.get_loc (pandas\_libs\index.c:5239)()
pandas\_libs\index.pyx in pandas._libs.index.IndexEngine.get_loc (pandas\_libs\index.c:5085)()
pandas\_libs\hashtable_class_helper.pxi in pandas._libs.hashtable.PyObjectHashTable.get_item (pandas\_libs\hashtable.c:20405)()
pandas\_libs\hashtable_class_helper.pxi in pandas._libs.hashtable.PyObjectHashTable.get_item (pandas\_libs\hashtable.c:20359)()
KeyError: 'id'
所以,我使用seaborn来绘制,并且绘制得非常完美。但是,我不确定如何传递“sd”列来绘制其中的误差线。
fig, ax = plt.subplots(figsize=(5,3))
ax = sns.pointplot(x="id", y="mean", data=df, join=False)
ax = plt.xticks(rotation=90)
ax = plt.tight_layout()
ax = plt.show()
fig, ax = plt.subplots(figsize=(25,5))
ax = sns.pointplot(x="id", y="mean", data=df, join=False)
ax.map(plt.errorbar, "id", "mean", "sd", marker="o")
ax = plt.xticks(rotation=90)
ax = plt.tight_layout()
ax = plt.show()
上面的代码抛出以下错误:
AttributeError Traceback (most recent call last)
<ipython-input-21-18652e3e8b12> in <module>()
1 fig, ax = plt.subplots(figsize=(25,5))
2 ax = sns.pointplot(x="id", y="mean", data=df, join=False)
----> 3 ax.map(plt.errorbar, "id", "mean", "sd", marker="o")
4 ax = plt.xticks(rotation=90)
5 ax = plt.tight_layout()
AttributeError: 'AxesSubplot' object has no attribute 'map'
我理想中想要的是一个类似于点图的图,但每个点具有不同的大小(由其相应的 sd 指定)或每个点都有一个误差条(由 sd 给出)。有人可以告诉我该怎么做吗?
最佳答案
只需使用matplotlib.axes.Axes.errorbar()
,如example所示添加这一行:
ax.errorbar(np.arange(len(df['id'])), df['mean'], yerr=df['sd'], ls='None')
但我认为你不必使用seaborn:
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
df = pd.DataFrame({"id":["ssa", "ssb", "ssc", "xxa", "xxb", "xxc"],
"mean":[1.3,1.5,5.2,3.1,2.1,3.2],
"sd":[0.9,0.5,0.3,0.1,0.2,0.3]})
plt.errorbar(np.arange(len(df['id'])), df['mean'], yerr=df['sd'], ls='None', marker='o')
ax = plt.gca()
ax.xaxis.set_ticks(np.arange(len(df['id'])))
ax.xaxis.set_ticklabels(df['id'], rotation=90)
plt.xlabel("id")
plt.ylabel("mean")
plt.show()
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
df = pd.DataFrame({"id":["ssa", "ssb", "ssc", "xxa", "xxb", "xxc"],
"mean":[1.3,1.5,5.2,3.1,2.1,3.2],
"sd":[0.9,0.5,0.3,0.1,0.2,0.3]})
fig, ax = plt.subplots()
size_scaler = 300 # Your points will be too small if you just use sd
ax.scatter(np.arange(len(df['id'])), df['mean'], s=df['sd']*size_scaler, marker='o')
ax.xaxis.set_ticks(np.arange(len(df['id'])))
ax.xaxis.set_ticklabels(df['id'], rotation=90)
plt.xlabel("id")
plt.ylabel("mean")
plt.show()
关于python - Matplotlib 散点图在 x 轴上不采用字符串?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45069139/
我正在处理一组标记为 160 个组的 173k 点。我想通过合并最接近的(到 9 或 10 个组)来减少组/集群的数量。我搜索过 sklearn 或类似的库,但没有成功。 我猜它只是通过 knn 聚类
我有一个扁平数字列表,这些数字逻辑上以 3 为一组,其中每个三元组是 (number, __ignored, flag[0 or 1]),例如: [7,56,1, 8,0,0, 2,0,0, 6,1,
我正在使用 pipenv 来管理我的包。我想编写一个 python 脚本来调用另一个使用不同虚拟环境(VE)的 python 脚本。 如何运行使用 VE1 的 python 脚本 1 并调用另一个 p
假设我有一个文件 script.py 位于 path = "foo/bar/script.py"。我正在寻找一种在 Python 中通过函数 execute_script() 从我的主要 Python
这听起来像是谜语或笑话,但实际上我还没有找到这个问题的答案。 问题到底是什么? 我想运行 2 个脚本。在第一个脚本中,我调用另一个脚本,但我希望它们继续并行,而不是在两个单独的线程中。主要是我不希望第
我有一个带有 python 2.5.5 的软件。我想发送一个命令,该命令将在 python 2.7.5 中启动一个脚本,然后继续执行该脚本。 我试过用 #!python2.7.5 和http://re
我在 python 命令行(使用 python 2.7)中,并尝试运行 Python 脚本。我的操作系统是 Windows 7。我已将我的目录设置为包含我所有脚本的文件夹,使用: os.chdir("
剧透:部分解决(见最后)。 以下是使用 Python 嵌入的代码示例: #include int main(int argc, char** argv) { Py_SetPythonHome
假设我有以下列表,对应于及时的股票价格: prices = [1, 3, 7, 10, 9, 8, 5, 3, 6, 8, 12, 9, 6, 10, 13, 8, 4, 11] 我想确定以下总体上最
所以我试图在选择某个单选按钮时更改此框架的背景。 我的框架位于一个类中,并且单选按钮的功能位于该类之外。 (这样我就可以在所有其他框架上调用它们。) 问题是每当我选择单选按钮时都会出现以下错误: co
我正在尝试将字符串与 python 中的正则表达式进行比较,如下所示, #!/usr/bin/env python3 import re str1 = "Expecting property name
考虑以下原型(prototype) Boost.Python 模块,该模块从单独的 C++ 头文件中引入类“D”。 /* file: a/b.cpp */ BOOST_PYTHON_MODULE(c)
如何编写一个程序来“识别函数调用的行号?” python 检查模块提供了定位行号的选项,但是, def di(): return inspect.currentframe().f_back.f_l
我已经使用 macports 安装了 Python 2.7,并且由于我的 $PATH 变量,这就是我输入 $ python 时得到的变量。然而,virtualenv 默认使用 Python 2.6,除
我只想问如何加快 python 上的 re.search 速度。 我有一个很长的字符串行,长度为 176861(即带有一些符号的字母数字字符),我使用此函数测试了该行以进行研究: def getExe
list1= [u'%app%%General%%Council%', u'%people%', u'%people%%Regional%%Council%%Mandate%', u'%ppp%%Ge
这个问题在这里已经有了答案: Is it Pythonic to use list comprehensions for just side effects? (7 个答案) 关闭 4 个月前。 告
我想用 Python 将两个列表组合成一个列表,方法如下: a = [1,1,1,2,2,2,3,3,3,3] b= ["Sun", "is", "bright", "June","and" ,"Ju
我正在运行带有最新 Boost 发行版 (1.55.0) 的 Mac OS X 10.8.4 (Darwin 12.4.0)。我正在按照说明 here构建包含在我的发行版中的教程 Boost-Pyth
学习 Python,我正在尝试制作一个没有任何第 3 方库的网络抓取工具,这样过程对我来说并没有简化,而且我知道我在做什么。我浏览了一些在线资源,但所有这些都让我对某些事情感到困惑。 html 看起来
我是一名优秀的程序员,十分优秀!