python - pandas str 和 object 类型之间的区别-6ren

python - pandas str 和 object 类型之间的区别

转载作者：IT老高更新时间：2023-10-28 21:10:22

25

4

Numpy 似乎区分了 str 和 object 类型。例如我可以做::

>>> import pandas as pd
>>> import numpy as np
>>> np.dtype(str)
dtype('S')
>>> np.dtype(object)
dtype('O')

其中dtype('S')和dtype('O')分别对应str和object。

然而，pandas 似乎缺乏这种区别，并将 str 强制转换为 object。::

>>> df = pd.DataFrame({'a': np.arange(5)})
>>> df.a.dtype
dtype('int64')
>>> df.a.astype(str).dtype
dtype('O')
>>> df.a.astype(object).dtype
dtype('O')

强制类型为 dtype('S') 也无济于事。::

>>> df.a.astype(np.dtype(str)).dtype
dtype('O')
>>> df.a.astype(np.dtype('S')).dtype
dtype('O')

对这种行为有什么解释吗？

最佳答案

Numpy 的字符串 dtypes 不是 python 字符串。

因此，pandas 故意使用原生 python 字符串，这需要 object dtype。

首先，让我演示一下我所说的 numpy 的字符串不同的含义:

In [1]: import numpy as np
In [2]: x = np.array(['Testing', 'a', 'string'], dtype='|S7')
In [3]: y = np.array(['Testing', 'a', 'string'], dtype=object)

现在，'x' 是一个 numpy 字符串 dtype(固定宽度，类似 c 的字符串)，而 y 是一个原生 python 字符串数组。

如果我们尝试超过 7 个字符，我们会立即看到差异。字符串 dtype 版本将被截断:

In [4]: x[1] = 'a really really really long'
In [5]: x
Out[5]:
array(['Testing', 'a reall', 'string'],
      dtype='|S7')

虽然对象 dtype 版本可以是任意长度:

In [6]: y[1] = 'a really really really long'

In [7]: y
Out[7]: array(['Testing', 'a really really really long', 'string'], dtype=object)

接下来，|S dtype 字符串无法正确保存 unicode，尽管也有 unicode 固定长度字符串 dtype。我暂时跳过一个例子。

最后，numpy 的字符串实际上是可变的，而 Python 字符串不是。例如:

In [8]: z = x.view(np.uint8)
In [9]: z += 1
In [10]: x
Out[10]:
array(['Uftujoh', 'b!sfbmm', 'tusjoh\x01'],
      dtype='|S7')

出于所有这些原因，pandas 选择永远不允许使用类似 C 的固定长度字符串作为数据类型。正如您所注意到的，在 pandas 中尝试将 python 字符串强制转换为固定的 numpy 字符串是行不通的。相反，它总是使用原生 Python 字符串，这对大多数用户来说表现得更加直观。

关于python - pandas str 和 object 类型之间的区别，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/34881079/

25

4

0

文章推荐： python - 有什么方法可以正确打印 OrderedDict？

文章推荐： java - 从内存分配的角度来看 ArrayList 与 LinkedList

文章推荐： python - SQLAlchemy:引擎、连接和 session 的区别

javascript - TypeError : Object [object Object], [object Object] 没有找到方法
我遵循了一本名为“Sitepoint Full Stack Javascript with MEAN”的书中的教程，我刚刚完成了第 6 章，应该已经创建了一个带有“数据库”的“服务器”。数据库只不过是
javascript - Ajax返回数组在PHP中显示[object Object],[object Object]
在 Jquery 中，我创建两个数组，一个嵌入另一个数组，就像这样...... arrayOne = [{name:'a',value:1}, {name:'b',value:2}] var arra
javascript - 为什么 ({}+{}) ="[object Object][object Object]"？
这个问题在这里已经有了答案: What is the explanation for these bizarre JavaScript behaviours mentioned in the 'Wa
angular - 无法解析...的所有参数([object Object]，[object Object]，？，？)
我被放在别人的代码上，有一个类用作其他组件的基础。当我尝试 ng serve --aot(或 build --prod)时，我得到以下信息。 @Component({ ...,
javascript - getJSON 只返回 [object Object],[object Object]
我正在测试一些代码，并使用数据创建了一个 json 文件。问题是我在警报中收到“[object Object],[object Object]”。没有数据。我做错了什么？这是代码:
javascript - print[ [object Object],[object Object]] 到json数组
我想打印 [object Object],[object Object] 以明智地 "[[{ 'x': '1', 'y': '0' }, { 'x': '2', 'y': '1' }]]"; 在 ja
javascript - Couchdb 列表仅返回 [object Object][object Object]
我有一个功能 View ，我正在尝试以特殊格式的方式输出。但我无法让列表功能正常工作。我得到的唯一返回是[object Object][object Object] [object Object]
javascript - TypeError Object[object object] 没有方法 SubSelf，TypeError Object[object object] 没有方法 intersectsPlane
在使用优秀的 Sim.js 和 Three.js 库处理 WebGL 项目时，我偶然发现了下一个问题: 一路走来，它使用了 THREE.Ray 的下一个构造函数: var ray = new THRE
javascript - React js 多选 [object Object], [object Object]
我正在使用 Material UI 进行多重选择。这是我的代码。 {listStates.map(col => (
javascript - jquery ajax [object Object] [object Object] 在列表中输出
我的代码使用ajax: $("#keyword").keyup(function() { var keyword = $("#keyword").val(); if (keyword.
angular - 无法解析 AuthenticationService : ([object Object], 的所有参数？，[object Object])
我遇到了下一个错误，无法理解如何解决它。 Can't resolve all parameters for AuthenticationService: ([object Object], ?, [o
Angular 10 FormArray ERROR 错误 : Cannot find control with name: '[object Object], [object Object],[object Object]
我正在尝试创建一个显示动态复选框的表单，至少应选中其中一个才能继续。我还需要获取一组选中的复选框。这是组件的代码: import { Component, OnInit } from '@angul
javascript - 为什么我在 UI 中没有收到验证 Flash 消息，我收到这样的 Flash 错误 [object Object],[object Object],[object Object]
我正在开发 NodeJs 应用程序，它是博客应用程序。我使用了快速验证器，我尝试在 UI 端使用快速闪存消息将帖子保存在数据库中之前使用闪存消息验证数据，我成功地将数据保存在数据库中，但在提交表单后消
jquery - $.getJSON 返回 “undefined” 或 [object Object] [object Object]
我知道有些人问了同样的问题并得到了解答。我已经查看了所有这些，但仍然无法解决我的问题。我有一个 jquery snipet，它将值发送到处理程序，处理程序处理来自 JS 的值并将数据作为 JSON 数
c# - object == object 而不是 object.id == object.id 潜在问题
我继承了一个非常草率的项目，我的任务是解释为什么它不好。我注意到他们在整个代码中都进行了这样的比较 (IQueryable).FirstOrDefault(x => x.Facility == fac
javascript - Object, Object 和 [1 : Object, 2 : Object]? 有什么区别
我只是在删除数组中的对象时偶然发现了这一点。代码如下: friends = []; friends.push( { a: 'Nexus', b: 'Muffi
objective-c - setting object = nil and [object release] VS [object release] and object = nil 有什么区别？
这两个代码片段有什么区别: object = nil; [object release] 对比 [object release]; object = nil; 哪个是最佳实践？最佳答案 object
javascript - Object.create(Object.prototype) , Object.create(Object) 和 Object.create(null) 之间的区别
我应该为其他人将从中继承的第一个父对象传递哪个参数，哪个参数更有效 Object.create(Object.prototype) Object.create(Object) Object.creat
objective-c - 执行cancelPreviousPerformRequestsWithTarget :selector:object: for all objects
我在不同的对象上安排不同的选择器 [self performSelector:@selector(doSmth) withObject:objectA afterDelay:1]; [self per
objective-c - 在 Objective-C 中打印 &object 和 object 的区别
NSLog(@"%p", &object); 和 NSLog(@"%p", object); 有什么区别？两者似乎都打印出一个内存地址，但我不确定哪个是对象的实际内存地址。最佳答案这就是我喜欢的

首页

博学

6Ren·AI

商城

python - pandas str 和 object 类型之间的区别