python - 对于 NumPy Unicode 数组，为什么 dtype '|U5' 变成 dtype '<U5' ？-6ren

python - 对于 NumPy Unicode 数组，为什么 dtype '|U5' 变成 dtype '

转载作者：行者123 更新时间：2023-12-05 04:35:36

34

4

我从这个答案的评论中了解到 Python: Numpy Data IO, how to save data by different dtype for each column?那<表示字节顺序，U表示unicode，5表示字符数。

然后'|'是什么在“|U5”中意味着“|”在下面的示例中更改为“<”？示例来自NumPy官方文档:https://numpy.org/devdocs/user/basics.io.genfromtxt.html

data = u"1, abc , 2\n 3, xxx, 4"
# Without autostrip
np.genfromtxt(StringIO(data), delimiter=",", dtype="|U5")

array([['1', ' abc ', ' 2'],
       ['3', ' xxx', ' 4']], dtype='<U5')

最佳答案

U数据类型将每个 Unicode 字符存储为 32 位整数(即 4 个字节)。超过一个字节的整数必须有字节顺序，因此数据类型将显示 <或 > . S 类型的数组将每个字符存储在一个字节中，因此字节顺序无关紧要，字节顺序字符将为 | .

例如这里a1和 a2包含单个 Unicode 字符。数组以相反的字节顺序创建。

In [248]: a1 = np.array(['π'], dtype='<U1')

In [249]: a2 = np.array(['π'], dtype='>U1')

In [250]: a1
Out[250]: array(['π'], dtype='<U1')

In [251]: a2
Out[251]: array(['π'], dtype='>U1')

检查每个数组中数据的实际字节数；您可以看到每种类型的不同顺序:

In [252]: a1.view(np.uint8)
Out[252]: array([192,   3,   0,   0], dtype=uint8)

In [253]: a2.view(np.uint8)
Out[253]: array([  0,   0,   3, 192], dtype=uint8)

当您指定 | 时在创建数组时使用 Unicode 类型，显然 NumPy 会忽略它并使用 native 字节顺序，例如

In [254]: np.dtype("|U5")
Out[254]: dtype('<U5')

还不如根本不包括它:

In [255]: np.dtype("U5")
Out[255]: dtype('<U5')

关于python - 对于 NumPy Unicode 数组，为什么 dtype '|U5' 变成 dtype '<U5' ？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/71012680/

34

4

0

文章推荐： c++ - 如何在 C++ 中完成行后删除间距？

文章推荐： java - 为什么我的 JavaFX 应用程序不显示 Web 浏览器？

文章推荐： simple-form - 简单表格不在顶部显示错误

文章推荐： python - 使用 Python 移动最小值

javascript - 阿拉伯文本不显示，但字符 Ø§Ù„Ù…Ù…Ù„Ùƒ 显示
我想显示阿拉伯文字，但字符 Ø§Ù„Ù…Ù…Ù„Ùƒ 显示。例如，在 Ø§Ù„Ù…Ù…Ù„ÙƒØ© Ø§Ù„Ø¹Ø±Ø¨ÙŠØ© Ø§Ù„Ø³Ø¹ÙˆØ¯ÙŠØ© 上显示单词 المملك٩ ا
java - 从 user_master 中选择不同的 u.id, u.first_name + ' ' + u.last_name , u.company_name u 给出错误的结果
我的应用程序正在 java + MSSQL 和 MySQL 上运行。下面的查询适用于 MSSQL，但不适用于 MySql。在 mysql 中，当我编写如下查询时，它给出了错误的结果查询 select
c++ - 为什么 `is_destructible` 使用 `declval().~U()` 而不是 `declval().~U()` 定义？
根据 is_destructible 的定义( http://eel.is/c++draft/meta.unary.prop#lib:is_destructible ), is_destructib

php - 为什么当我调用 Ú† 时，MySQL 查询显示 Ù† 和 Ú† 的结果？

我有一个数据库表，其中有一列我对波斯字母进行了分类，以便稍后使用 MySQL WHERE 选择。一切都适用于所有字母，但我在选择在数据库中存储为 (Ù†) 的字母 (?) 和存储为 (Ú†) 的 (?

swift - 为什么我不能调用 map(_ transform : (Wrapped) -> U) -> U? 并同时使用可选链接？

我知道像这样的可选链接: someOptional?.someProperty 基本上是 someOptional.map { $0.someProperty } 但是，我发现同时做这两件事是不可能的

u-boot - u-boot中的CONFIG_SYS_EXTRA_OPTIONS是什么？

u-boot配置文件中的以下配置我看不懂 CONFIG_SYS_EXTRA_OPTIONS="SYS_SDRAM_SIZE=0x20000000" 好像在 u-boot 代码中设置 DRAM 大小。但

java - 和不一样吗？

我对以下两个方法声明感到困惑: private T funWorks(T child, U parent) { // No compilation errors }

java - 给定 `T` 和 `U` 其中 `T extends U` 如何返回 `U`

给定如下 API: class Bar { ... } class Foo extends Bar { ... } 在 Java 的 Optional 类型中，我们可以说: Optional fooO

linux - 为什么 sort -u 将 U+2161 和 U+2162 视为相同的字符？

我有一个文件，每行有两个字符: $ cat roman Ⅱ Ⅲ nut 当我用 sort -u 对这个文件进行排序时，只显示一行: $ sort -u roman Ⅱ Ⅱ是代码点U+2161，Ⅲ是代码

c++ - 将 C 数组分配给 C+ +'s std::array? (std::array = T[U]) - no suitable constructor exists from "T [U ]"to "std::array"

我正在尝试将 C 数组分配给 C++ std::array。我该如何做到这一点，最干净的方式并且不制作不需要的拷贝等？什么时候做 int X[8]; std::array Y = X; 我得到一个

scala - 是否可以创建可用作 T[A, B] 的泛型类型 T[A < : C[U], B < : C[U], U]？

我有以下案例类: case class [Q Length[T] 但是，我收到一条错误消息，说需要三个参数，而我只给出了两个。我希望它像这样工作: type Area[T] = [Length[T

rust - 对于所有类型 `T` 、 `U` 是否真的，如果 `T` 被强制转换为 `U` 那么 `&T` 被强制转换为 `&U` ？

它是 well documented那个[T; n]可以强制到[T] .下面的代码也是well-formed : fn test(){ let _a: &[i32] = &[1, 2, 3];

python - tkinter.TclError : character U+1f449 is above the range (U+0000-U+FFFF) allowed by Tcl 错误

我正在尝试使用 tweepy 在 Tkinter 窗口上显示我的 Twitter 时间线。这是代码 import tweepy import tkinter consumer_key = 'xxxxx

regex - 使用正则表达式查找 ü(带有变音符号的 u)

我正在使用以下包含 letter ü 的文本片段: test für fur test 代码如下: import re for m in re.finditer(r, line, re.IGNOREC

u-sql - U-SQL 中的类型转换

我对 USQL 很陌生，想知道如何在 select 语句中将“日期时间”转换为“日期”。另外，我如何摆脱毫秒和上午/下午？我真的很感激这方面的任何帮助。谢谢你们。最佳答案下面是有效的代码。注意括号

u-sql - U-SQL 是否允许自定义代码调用外部服务

在 U-SQL 自定义代码(代码隐藏或程序集)中可以调用外部服务，例如bing搜索或 map 。谢谢，纳西尔最佳答案由于以下原因，目前不支持此功能: 想象一下，您编写了一个 UDF 或 UDO

u-boot - u-boot 可以支持多个以太网端口吗？

我想 ping 出多个以太网端口。 u-boot 仅支持单个以太网端口是否存在固有限制？最佳答案 Can u-boot support more than one ethernet port? 是的

list - A U B U C的序言联盟

我最近开始学习Prolog，但无法解决如何将三个列表合并的问题。我能够合并两个列表: %element element(X,[X|_]). element(X,[_|Y]):-

u-boot - armv7 u-boot使用MMU吗？

我们使用 Beaglebone 黑色定制板。我编辑了一个链接器脚本文件以添加内存部分以在其中记录一些信息: . = ALIGN(4); .logging : { _log_begin

u-boot - armv7 u-boot使用MMU吗？

我们使用 Beaglebone 黑色定制板。我编辑了一个链接器脚本文件以添加内存部分以在其中记录一些信息: . = ALIGN(4); .logging : { _log_begin

首页

博学

6Ren·AI

商城