- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个已处理的 R 数据框:
import rpy2.robjects as ro
from rpy2.robjects.packages import importr
from rpy2.robjects import pandas2ri
from rpy2.robjects.conversion import localconverter
pandas2ri.activate()
import pandas as pd
%%R
n = c(2, 3, 5)
s = c("aa", "bb", "cc")
b = c(TRUE, FALSE, TRUE)
r_df = data.frame(n, s, b)
r_df[['c']]=NA
r_df
#out:
# n s b c
#1 2 aa 1 NA
#2 3 bb 0 NA
#3 5 cc 1 NA
当我将其转换为 pandas 时,它会将 NA
替换为整数。
with localconverter(ro.default_converter + pandas2ri.converter):
pd_from_r_df = ro.conversion.rpy2py(ro.r('r_df'))
pd_from_r_df
#Out:
# n s b c
#1 2.0 aa 1 -2147483648
#2 3.0 bb 0 -2147483648
#3 5.0 cc 1 -2147483648
我尝试在r_df
的列中设置不同的数据类型,但没有成功。我该如何解决这个问题?
请注意,在转换为 pandas 之前设置 r_df[is.na(r_df)]='None'
可以解决该问题。但应该比这个简单
最佳答案
可能的问题是,R 对于 bool 值(R 术语中的“逻辑向量”)和整数值具有“NA”值,而 Python/numpy 则没有。
看看以下两个示例之间的 dtype
是如何变化的:
In [1]: import pandas
In [2]: pandas.Series([True, False, True])
Out[2]:
0 True
1 False
2 True
dtype: bool
In [3]: pandas.Series([True, False, None])
Out[3]:
0 True
1 False
2 None
dtype: object
这里发生的情况是,R 数据框中的“c”列的类型为“逻辑”(LGLSXP
),但在 C 中,这是一个整数值的 R 数组,仅使用以下之一0、1 和 -2147483648(分别表示 FALSE
、TRUE
和 NA
)。 rpy2 转换器正在转换为整数的 numpy
向量,因为:
rpy2
实现 numpy array interface允许跨两种语言匹配 C 数组。numpy
使用该接口(interface) ( numpy.array()
is called by rpy2
)诚然,这只是实现转化的方法之一,在某些情况下这并不是最方便的。使用自定义转换器可以获得更适合您的行为。
PS:关于下面的解决方法的更多说明
Note, setting r_df[is.na(r_df)]='None' prior to converting to pandas solves the issue. But it should be simpler than this
这里发生的事情是将 R bool 向量转换为字符串向量。
关于python - Rpy2 将 df 转换回 pandas 时出现问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55967536/
我正在从事密室逃脱项目。实际上,我试图创建的行为如下: 网络浏览器以通常的方式显示网络应用程序的一部分。从此时起,客户端上将不再有键盘/鼠标的输入。我已经使用 JS 解决了基于时间的更改,因此我可以加
背景 我试图使用 netatalk创建 Time Capsule使用 Raspberry Pi 3 ,按照教程here .部分版本信息: netatalk 3.1.12 macOS 10.14.5 树
目标:将i2c时钟频率更改为400 khz。动机:试图通过i2c使用Adafruit BNO085,但RPI i2c时钟伸展存在已知问题。(这是一个已知的漏洞,自2012年以来一直在传播)。。我一直在
我正在尝试编写一个小脚本来基于两个因素控制两个树莓派的 gpio 输出引脚:GPIO.input.17 的状态和一天中的时间。 我希望 gpio.output.23 和 gpio.output.25
拥有运行Docker 17.11.0-ce和Docker Compose 1.17.1的RaspberryPi。 我有一个包含两个容器的docker-compose文件,都将restart-polic
我正在尝试使用 Raspbian 在 Raspberry Pi 3 上从另一个 python 脚本运行 python 脚本。几个小时以来,我一直在努力寻找方法来做到这一点,但没有找到任何有效的方法。我
我想通过 Python 使用 R。我想知道要安装哪个版本的 rpy,文档中并不清楚。 我使用的是 OSX 10.5 (leopard) 的 Mac。 我使用Python 2.7版本。 感谢您的帮助!
我在qtdesigner中设计了一个表单。它具有“开”和“关”按钮。开按钮应该开始闪烁,而关按钮应该停止它。因此,如果time.sleep持续时间很短,那没有问题,但是当我写10秒钟的 sleep 时
当我尝试运行应用程序时(只是一个简单的hello_world.c不起作用),每次都会收到此错误: mpiexec -ckpointlib blcr -ckpoint-prefix /tmp/ -ckp
所以我正在尝试设计一个 LCD 屏幕,它有一个菜单和一堆不同的功能,并且它应该有 4 个按钮。选择、菜单以及向上和向下。现在我只是想处理菜单按钮。我希望它始终显示时钟,除非按下菜单按钮。但是当我按下按
我按照此处的说明在我的 Raspberry Pi 上成功安装了 Keras: https://medium.com/@abhizcc/installing-latest-tensor-flow-and
这里的真正目标是在Python中找到分位数平均值(或总和,或中位数等)。由于我不是 Python 的高级用户,但已经使用 R 一段时间了,所以我选择的路线是通过 Rpy。但是,我遇到了以下问题:返回的
在多处理环境中调用 RPy 函数是否安全?关于 RPy 是否存在任何应该注意的多处理问题? 一个简单的例子如下: from multiprocessing import Pool from rpy i
我正在开发一个将 Android 设备与 Raspberry Pi 连接起来的项目。 RPi 需要被视为用户永远不需要触摸的可部署设备。出于这个原因,我正在尝试在 RPi 上编写一个启动批处理脚本,允
我正在尝试从服务器向客户端发送数据字节,因此我使用文件指针来指向文件已读取的位置并读取字节集并将其发送到客户端。 下面是服务器端 byte[] b = readByte()// my function
我正在尝试将 MySQL 数据库从我的 Raspberry Pi 重新定位到我的外部硬盘驱动器,以便我可以保留更大的数据库。我对此知之甚少,所以如果这个问题太简单,我深表歉意,但这些是我迄今为止所采取
我被 Python 包中的 wait_for_edge 函数卡住了 RPi .我为下降的 gpio 添加了多个事件检测,只要回调函数不包含像 os.system("mpc pause") 然后脚本崩
我尝试在 Raspberry Pi 上升级现有的 JDK8,但失败了。 我从oracle网站下载了ARM版本,在Windows中解压,通过FTP传输到我的pi上,然后复制到/usr/local。 然后
我的代码是这样的 package me.Andrew.Keypad.Listener; import java.util.HashMap; import com.pi4j.io.gpio.GpioCo
编写脚本保存在闪存驱动器上,用于更新多个树莓派上的代码。我的想法是,我将目录从树莓派 sd 卡备份到闪存驱动器,然后将新文件从闪存驱动器复制到 pi 中的 sd 卡。 我得到的行为是所有内容都从闪存移
我是一名优秀的程序员,十分优秀!