- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我想将 pandas 与 numpy 一起用于我的所有分析,但使用 Rpy2 来绘制我的数据。我想使用 pandas 数据帧进行所有分析,然后通过 rpy2 使用 R 的完整绘图来绘制这些。 py2,并且正在使用 ipython 进行绘图。执行此操作的正确方法是什么?
我尝试的几乎所有命令都失败了。例如:
df
两列之间的散点图。我希望在 x/y 轴中使用 df
的标签,就像它是 R 数据帧时一样。有没有办法做到这一点?当我尝试使用 r.plot
执行此操作时,我得到了这个乱码图:In: r.plot(df.a, df.b) # df 是 pandas DataFrame
产量:
输出:rpy2.rinterface.NULL
导致情节:
如您所见,轴标签乱七八糟,它没有像应该的那样从 DataFrame 读取轴标签(X 轴是 df
的 a
列Y 轴是 b
列)。
如果我尝试使用 r.hist
制作直方图,它根本不起作用,并产生错误:
In: r.hist(df.a)
Out:
...
vectors.pyc in <genexpr>((x,))
293 if l < 7:
294 s = '[' + \
--> 295 ', '.join((p_str(x, max_width = math.floor(52 / l)) for x in self[ : 8])) +\
296 ']'
297 else:
vectors.pyc in p_str(x, max_width)
287 res = x
288 else:
--> 289 res = "%s..." % (str(x[ : (max_width - 3)]))
290 return res
291
TypeError: slice indices must be integers or None or have an __index__ method
导致这个情节:
知道错误是什么意思吗?在这里,轴又乱七八糟,乱七八糟的数据。
编辑:此错误仅在使用 ipython 时发生。当我从脚本运行命令时,它仍然会产生有问题的图,但至少运行时没有错误。从 ipython 调用这些命令一定有问题。
我还尝试按照下面海报的建议将 pandas DataFrame df
转换为 R DataFrame,但也失败并出现此错误:
com.convert_to_r_dataframe(mydf) # mydf is a pandas DataFrame
----> 1 com.convert_to_r_dataframe(mydf)
in convert_to_r_dataframe(df, strings_as_factors)
275 # FIXME: This doesn't handle MultiIndex
276
--> 277 for column in df:
278 value = df[column]
279 value_type = value.dtype.type
TypeError: iteration over non-sequence
我怎样才能让这些基本的绘图功能在 Pandas DataFrame 上工作(从 Pandas DataFrame 的标签中读取绘图标签),并让 Pandas DF 到 R DF 之间的转换工作?
EDIT2:这是一个 csv 文件“test.txt”(http://pastebin.ca/2311928)的完整示例和我回答@dale 评论的代码:
import rpy2
from rpy2.robjects import r
import rpy2.robjects.numpy2ri
import pandas.rpy.common as com
from rpy2.robjects.packages import importr
from rpy2.robjects.lib import grid
from rpy2.robjects.lib import ggplot2
rpy2.robjects.numpy2ri.activate()
from numpy import *
import scipy
# load up pandas df
import pandas
data = pandas.read_table("./test.txt")
# plotting a column fails
print "data.c2: ", data.c2
r.plot(data.c2)
# Conversion and then plotting also fails
r_df = com.convert_to_r_dataframe(data)
r.plot(r_df)
绘制“data.c2”列的调用失败,即使 data.c2 是 pandas df 的列,因此就所有意图和目的而言应该是一个 numpy 数组。我使用 activate()
调用,所以我认为它会将此列作为一个 numpy 数组处理并绘制它。
在转换为 R 数据帧后第二次调用绘制数据帧 data
也失败了。这是为什么?如果我从 R 加载 test.txt
作为数据框,我可以 plot()
它并且因为我的数据框已从 pandas 转换为 R,它看起来像它也应该在这里工作。
当我在 ipython 中尝试 rmagic
时,由于某种原因它没有启动绘图窗口,尽管它没有出错。 IE。如果我这样做:
In [12]: X = np.array([0,1,2,3,4])
In [13]: Y = np.array([3,5,4,6,7])
In [14]: import rpy2
In [15]: from rpy2.robjects import r
In [16]: import rpy2.robjects.numpy2ri
In [17]: import pandas.rpy.common as com
In [18]: from rpy2.robjects.packages import importr
In [19]: from rpy2.robjects.lib import grid
In [20]: from rpy2.robjects.lib import ggplot2
In [21]: rpy2.robjects.numpy2ri.activate()
In [22]: from numpy import *
In [23]: import scipy
In [24]: r.assign("x", X)
Out[24]:
<Array - Python:0x592ad88 / R:0x6110850>
[ 0, 1, 2, 3, 4]
In [25]: r.assign("y", Y)
<Array - Python:0x592f5f0 / R:0x61109b8>
[ 3, 5, 4, 6, 7]
In [27]: %R plot(x,y)
没有错误,但也没有绘图窗口。无论如何,如果可能的话,我想坚持使用 rpy2 而不是依赖 rmagic
。
谢谢。
最佳答案
[注意:您在“edit 2”中的代码在这里工作(Python 2.7、rpy2-2.3.2、R-1.15.2)。]
正如 @dale 提到的,每当 R 对象是匿名的(即对象不存在 R 符号)时,R deparse(substitute())
将最终返回 structure()
的 R 对象,一个可能的解决方法是指定“xlab”和“ylab”参数;对于某些情节,您还必须指定 main
(标题)。
解决此问题的另一种方法是使用 R 的公式并提供数据框(在我们计算出转换部分后,下面会详细介绍)。
忘记 pandas.rpy
中的内容。它既损坏又似乎忽略了 rpy2 中可用的功能。
较早的quick fix to conversion with ipython可以很容易地转换为适当的转换。我正在考虑在 rpy2 代码库中添加一个(有更多的功能),但与此同时,只需在代码示例中的所有导入之后添加以下代码段。每当进行 R 调用时,它都会透明地将 pandas 的 DataFrame
对象转换为 rpy2 的 DataFrame
。
from collections import OrderedDict
py2ri_orig = rpy2.robjects.conversion.py2ri
def conversion_pydataframe(obj):
if isinstance(obj, pandas.core.frame.DataFrame):
od = OrderedDict()
for name, values in obj.iteritems():
if values.dtype.kind == 'O':
od[name] = rpy2.robjects.vectors.StrVector(values)
else:
od[name] = rpy2.robjects.conversion.py2ri(values)
return rpy2.robjects.vectors.DataFrame(od)
elif isinstance(obj, pandas.core.series.Series):
# converted as a numpy array
res = py2ri_orig(obj)
# "index" is equivalent to "names" in R
if obj.ndim == 1:
res.names = ListVector({'x': ro.conversion.py2ri(obj.index)})
else:
res.dimnames = ListVector(ro.conversion.py2ri(obj.index))
return res
else:
return py2ri_orig(obj)
rpy2.robjects.conversion.py2ri = conversion_pydataframe
现在下面的代码将“正常工作”:
r.plot(rpy2.robjects.Formula('c3~c2'), data)
# `data` was converted to an rpy2 data.frame on the fly
# and the a scatter plot c3 vs c2 (with "c2" and "c3" the labels on
# the "x" axis and "y" axis).
我还注意到您正在导入 ggplot2
,但没有使用它。目前转换必须明确要求。例如:
p = ggplot2.ggplot(rpy2.robjects.conversion.py2ri(data)) +\
ggplot2.geom_histogram(ggplot2.aes_string(x = 'c3'))
p.plot()
关于python - 如何在 Rpy2 中使用 pandas 数据帧和 numpy 数组?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14656852/
我正在从事密室逃脱项目。实际上,我试图创建的行为如下: 网络浏览器以通常的方式显示网络应用程序的一部分。从此时起,客户端上将不再有键盘/鼠标的输入。我已经使用 JS 解决了基于时间的更改,因此我可以加
背景 我试图使用 netatalk创建 Time Capsule使用 Raspberry Pi 3 ,按照教程here .部分版本信息: netatalk 3.1.12 macOS 10.14.5 树
目标:将i2c时钟频率更改为400 khz。动机:试图通过i2c使用Adafruit BNO085,但RPI i2c时钟伸展存在已知问题。(这是一个已知的漏洞,自2012年以来一直在传播)。。我一直在
我正在尝试编写一个小脚本来基于两个因素控制两个树莓派的 gpio 输出引脚:GPIO.input.17 的状态和一天中的时间。 我希望 gpio.output.23 和 gpio.output.25
拥有运行Docker 17.11.0-ce和Docker Compose 1.17.1的RaspberryPi。 我有一个包含两个容器的docker-compose文件,都将restart-polic
我正在尝试使用 Raspbian 在 Raspberry Pi 3 上从另一个 python 脚本运行 python 脚本。几个小时以来,我一直在努力寻找方法来做到这一点,但没有找到任何有效的方法。我
我想通过 Python 使用 R。我想知道要安装哪个版本的 rpy,文档中并不清楚。 我使用的是 OSX 10.5 (leopard) 的 Mac。 我使用Python 2.7版本。 感谢您的帮助!
我在qtdesigner中设计了一个表单。它具有“开”和“关”按钮。开按钮应该开始闪烁,而关按钮应该停止它。因此,如果time.sleep持续时间很短,那没有问题,但是当我写10秒钟的 sleep 时
当我尝试运行应用程序时(只是一个简单的hello_world.c不起作用),每次都会收到此错误: mpiexec -ckpointlib blcr -ckpoint-prefix /tmp/ -ckp
所以我正在尝试设计一个 LCD 屏幕,它有一个菜单和一堆不同的功能,并且它应该有 4 个按钮。选择、菜单以及向上和向下。现在我只是想处理菜单按钮。我希望它始终显示时钟,除非按下菜单按钮。但是当我按下按
我按照此处的说明在我的 Raspberry Pi 上成功安装了 Keras: https://medium.com/@abhizcc/installing-latest-tensor-flow-and
这里的真正目标是在Python中找到分位数平均值(或总和,或中位数等)。由于我不是 Python 的高级用户,但已经使用 R 一段时间了,所以我选择的路线是通过 Rpy。但是,我遇到了以下问题:返回的
在多处理环境中调用 RPy 函数是否安全?关于 RPy 是否存在任何应该注意的多处理问题? 一个简单的例子如下: from multiprocessing import Pool from rpy i
我正在开发一个将 Android 设备与 Raspberry Pi 连接起来的项目。 RPi 需要被视为用户永远不需要触摸的可部署设备。出于这个原因,我正在尝试在 RPi 上编写一个启动批处理脚本,允
我正在尝试从服务器向客户端发送数据字节,因此我使用文件指针来指向文件已读取的位置并读取字节集并将其发送到客户端。 下面是服务器端 byte[] b = readByte()// my function
我正在尝试将 MySQL 数据库从我的 Raspberry Pi 重新定位到我的外部硬盘驱动器,以便我可以保留更大的数据库。我对此知之甚少,所以如果这个问题太简单,我深表歉意,但这些是我迄今为止所采取
我被 Python 包中的 wait_for_edge 函数卡住了 RPi .我为下降的 gpio 添加了多个事件检测,只要回调函数不包含像 os.system("mpc pause") 然后脚本崩
我尝试在 Raspberry Pi 上升级现有的 JDK8,但失败了。 我从oracle网站下载了ARM版本,在Windows中解压,通过FTP传输到我的pi上,然后复制到/usr/local。 然后
我的代码是这样的 package me.Andrew.Keypad.Listener; import java.util.HashMap; import com.pi4j.io.gpio.GpioCo
编写脚本保存在闪存驱动器上,用于更新多个树莓派上的代码。我的想法是,我将目录从树莓派 sd 卡备份到闪存驱动器,然后将新文件从闪存驱动器复制到 pi 中的 sd 卡。 我得到的行为是所有内容都从闪存移
我是一名优秀的程序员,十分优秀!