- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我先说两件事:
我正在努力将一个项目从 R 移植到 python,并且正在努力寻找一种转换文本到 float 转换过程的好方法。具体来说,我是:
error='coerce'
选项强制从文本强制转换为 float 如何让 pandas 将浮点值的文本表示干净利落地转换为相应的 float ?
我遇到的问题是数值精度。例如:
In[1]: pd.to_numeric('3.785', errors='coerce')
Out[2]: 3.7850000000000001
我明白为什么会这样(即 3.785 的表示方式不容易在底层二进制表示中表示)。我想弄清楚的是,是否有一种方法可以解决它高效发生的原因。
例如,在 R 中,幕后发生了很多事情,但在 as.numeric API 中,您得到的数字表面上由文本值表示:
> as.numeric('3.785')
[1] 3.785
这是我想要的行为。这可能使用 Pandas / python 吗?我愿意合并其他软件包,或者被告知“那是不可能的”。
最佳答案
我不确定您是在问更多关于精度还是精度显示(格式)的问题,但希望这个答案能解决这两个问题。
在幕后,r 和 pandas 可能在做完全相同的事情,但默认显示让它看起来不同。例如,如果您想更好地了解 r 如何存储数字,您可以这样做:
> sprintf( "%.20f", as.numeric('3.785') )
[1] "3.78500000000000014211"
当然,一旦您超过了小数点后第 14 位左右,您就超出了 double float 中可以存储的内容,这些数字实际上没有意义。尽管如此,这至少应该足以表明 r 并没有真正将其存储为完全 3.785
。
诚然,有比某处更严格的答案,但实际上“忽略小数点后第 13 位或第 14 位的任何内容”对于标准数据工作几乎总是足够的(而且你几乎肯定最好花钱你的时间在别处,而不是担心小数点后第 14 位)。
我不能确切地说出为什么你使用的 pandas 函数显示 3.7850000000000001
而不是 3.785
但一般来说你可以在不同的部分获得不同级别的默认显示精度numpy 和 Pandas 。例如,如果您只是将 [
和 ]
放在您的数字周围(以传递列表而不是标量),pd.to_numeric
将具有输出一个 numpy 数组,并显示更少的小数位:
In [61]: pd.to_numeric(['3.785'], errors='coerce')
Out[61]: array([ 3.785])
如果您传递的是系列而不是列表,您也会得到类似的显示输出。如果您想要特定级别的显示精度,只需明确指定即可:
In [62]: pd.to_numeric(pd.Series(['3.785']), errors='coerce').map('{:,.20f}'.format)
Out[62]:
0 3.78500000000000014211
因此,当您明确显示 20 位小数时,您会在 r 和 pandas/numpy 中看到相同的数字表示。
也许值得一提的是 python 确实提供了一个 Decimal type它具有精确的小数点(不同于单精度或 double float ),但很少将其用于数据科学或数值应用,因为它不是原生的 pandas 类型,而且性能通常会很差。我相信它主要用于会计应用程序。
关于python - Pandas to_numeric 数值精度,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48547017/
我正在开发一个 Java 脚本,为此我需要正则表达式来检查文本框中输入的文本是否应该是字母和数值的组合。 我尝试了 Java 脚本的 NaN 函数,但字符串的最小长度和最大长度应为 4,并以字母作为第
我给出了两个长方体,其中只有一个轴对齐(另外两个不需要对齐)和顶点坐标(在全局坐标系中),我知道它们相交。我正在寻找一种可以计算路口体积的算法。 为了检查交点,我使用了分离轴定理。 最佳答案 可以通过
我有一个类似这样的对象的 json 列表 [{ "something": "bla", "id": 2 }, { "something": "yes", "id": 1
这是一篇很长的文章,但请留在我身边... 我有一个字典,它将“PO”保存为Key,将“SO”保存为项目(在某些情况下,某个“PO”可能有多个“SO”) . 工作表中的我的 Excel 数据,字典在其中
我的问题是是否有办法使用 terms include在 numeric field在 elasticsearch aggregation . 我在 Elasticsearch 中对多个字段使用通用查询
我有一个 perl 代码片段 use JSON::XS; $a = {"john" => "123", "mary" => "456"}; print encode_json($a),"\n"; 输出
我想对 python 进行一个条件测试,以检查给定输入数字的值是否等于或小于 9,并且大于或等于 0。 number =input( "Please enter a number! :" ) Plea
我有一个这样的对象: var rock = { 5: 0.5, 0: 0.8, 10: 0.3, 2: 1.0, } 我有一个像 4.3 这样的数字,我需要前后数字的索引和值。在这个例子中我会
对于 iOS 中的 Objective-C: 如果我有一个字符串,如何读取单个字符的 unicode 数值? 例如,如果我的字符串是:“Δ”,unicode 字符是 U+0394,那么我如何读取该字符
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的,
我有这样的数组 var arrayVal_Int = ["21", "53", "92", "79"]; var arrayVal_Alpha = ["John", "Christine", "L
就像标题暗示我需要做这样的事情...... $i++;//we all know this. $value = 'a'; increment($value);// i need this functi
我有一个文件,其中包含一些不同值的概率,例如: 1 0.1 2 0.05 3 0.05 4 0.2 5 0.4 6 0.2 我想使用此分布生成随机数。是否存在处理此问题的现有模块?自己编写代码相当简单
因此,我在从使用 RCPP 创建的函数返回值时遇到了一些问题。它只返回 NumericVector 的第一个值。问题是当我在自身内部调用函数并将 NumericVector 传递回 out 变量时。任
我有下面的数字 vector 模板类(用于数值计算的 vector )。我正在尝试使编写 D=A+B+C 成为可能,其中所有变量都是 Vector 对象。 A、B 和 C 不应修改。我的想法是使用 V
本文实例讲述了mysql常用函数。分享给大家供大家参考,具体如下: 本文内容: mysql函数的介绍 聚集函数 avg count max
我正在尝试使用 python(无关)为我的公司自动化一些事情,这就是我的问题。首先,我正在从邮箱中的特定文件夹创建数据框。(到这里没问题)” RangeIndex: 36 entries, 0 to
我在让 Angular ng-if 工作时遇到了一些麻烦。我希望我的 DOM 元素之一在 $scope.week = 1 时消失。 在我的 Controller 中我设置了 $scope.week =
我正在阅读 Ingersoll、Morton 和 Farris 撰写的 Taming Text,但我不明白 solr 的数字 trie 实现如何帮助搜索文本?我对 solr.TrieField fie
这个问题已经有答案了: What is the difference between client-side and server-side programming? (3 个回答) 已关闭 9 年前
我是一名优秀的程序员,十分优秀!