- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我最近开始学习 McKinney 的 Python 进行数据分析。这本书把我绊倒了:
Array slices are views on the original array. This means data is not copied and any modifications to the view will be reflected in the source array ... As NumPy has been designed with large data use case in mind, you could imagine performance and memory problems if NumPy insisted on copying data left to right.
很好。似乎是一个明智的设计选择。但两页后它说:
Selecting data from an array by boolean indexing always creates a copy of the data, even if the returned array is unchanged.
等等,什么?还有,
You can even mix and match boolean arrays with slices ... e.g.
data[names == 'Bob', 2:]
现在会返回什么?数据副本的 View ?为什么这种行为是这样的?来自 R,我看到 bool 索引和基于位置的索引同样常用的技术。如果 NumPy 的设计旨在避免复制内存,那么是什么插入了这一设计选择?
谢谢。
最佳答案
让我们假设一个一维数组。内存中的数据看起来像这样:
10 | 11 | 12 | 13 | 14 | 15 | 16
通过索引访问元素是微不足道的。直接取第一个元素的位置,跳n
步。所以,对于 arr[2]
:
10 | 11 | 12 | 13 | 14 | 15 | 16
^
我可以通过一次乘法得到内存中的位置。快速简单。
我可以做一个切片,然后说“只取 arr2 = arr[2:-1]
”:
10 | 11 | 12 | 13 | 14 | 15 | 16
^----^----^----^
现在,内存布局非常相似。获取一个元素是从一个新的起点开始的乘法运算。 arr2[1]
:
10 | 11 | 12 | 13 | 14 | 15 | 16
(ignore) -----^----------
你可以做一个更有趣的把戏,说 arr3 = arr[::2]
,让所有元素各跳一个。
10 | 11 | 12 | 13 | 14 | 15 | 16
^---------^---------^---------^
同样,获取 arr3
的索引非常简单:只需进行乘法运算,但现在大小变大了。这就是 strides 的目的,它们告诉你 block 的大小以及如何通过索引获取元素。步幅在更多维度上更加强大。顺便说一下,这是我们可以将内存 (1D) 转换为矩阵 (2D) 的方法。
现在,我们来看看 bool 数组。如果我的掩码是:T F T T F F T
,我问你第三个元素,你需要遍历掩码,找到第三个为真,然后得到它的索引;因此,非常慢。因此,当采用 bool 掩码时,我们必须复制数据。有一些面具不能用步幅来表示,但不是一般情况下,所以为了保持一致,总是一个副本。
附带说明,有时,制作副本的成本在性能方面是值得的。如果要进行很多读取“数组的每五个元素”的操作,内存中的数据将不会对齐,因此CPU每次都必须等待它被读取。制作单个副本(将是连续的)并使用它会更快。
关于python - numpy:在整数索引与 bool 索引上复制值默认值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23266343/
我正在尝试学习 Fortran,并且看到了很多不同的定义,我想知道他们是否正在尝试完成同样的事情。以下有什么区别? 整数*4 整数(4) 整数(kind=4) 最佳答案 在 Fortran >=90
我以前从未编程过,最近(1 周前)才开始学习!第一门类(class)是函数式编程,使用 Haskell。 我有一项学校作业,我想通过删除一两个步骤来改进它,但我遇到了一个讨厌的错误。 基本上,我创建了
给定以下GraphQL请求和变量: 请求: query accounts($filter:AccountFilter, $first_:String, $skip_:Int) { accounts
我已经搜索了 StackOverflow,但找不到关于如何检查计算器应用程序的数字输入正则表达式的答案,该计算器应用程序将检查每个 keyup 的以下格式(jquery key up): 任何整数,例
类似于我上一篇致歉的文章,但没有那么长篇大论。基本上我想知道当每次重绘调用只重绘屏幕的一小部分时,优化重绘到 JFrame/JPanel 的最佳选择是什么。 此外,除了重绘重载之外,我并不是 100%
所以在我的教科书中有一个使用 f# 的递归函数的例子 let rec gcd = function | (0,n) -> n | (m,n) -> gcd(n % m,m);; 使用此功能,我的教科书
我有一个数据结构,例如表达式树或图形。我想添加一些“测量”功能,例如depth和 size . 如何最好地键入这些函数? 我认为以下三个变体的用处大致相同: depth :: Expr -> Int
这样写比较好 int primitive1 = 3, primitive2 = 4; Integer a = new Integer(primitive1); Integer b = new Inte
我是 Java 8 新手,想根据键对 Map 进行排序,然后在值内对每个列表进行排序。 我试图寻找一种 Java 8 方法来对键和值进行排序。HashMap>映射 map.entrySet().str
这就是我的目标... vector ,int> > var_name (x, pair (y),int>); 其中 x 是 vector var_name 的大小,y 是对内 vector 的大小。
这里是 an answer to "How do I instantiate a Queue object in java?" , Queue is an interface. You can't i
这个问题在这里已经有了答案: Weird Integer boxing in Java (12 个答案) Why are autoboxed Integers and .getClass() val
我们可以使用 C++ STL 做这样的事情吗?如果是,我将如何初始化元素?我试图这样做,但没有成功。 pair,vector>p; p.first[0]=2; 最佳答案 Can we do som
您好,我正在尝试为百分比和整数数组中的数字找到索引。假设 arraynum = ['10%','250','20%','500'] 并且用户发送一个值 15%,这个数字在哪个范围内居住?我可以使用这段
我与三列有关系:ProductName、CategoryID 和 Price。我需要选择仅那些价格高于给定类别中平均产品价格的产品。(例如,当apple(ProductName)是fruit(Cate
我已经坚持了一段时间,我正在尝试将一些数据配对在一起。这是我的代码。 #include #include using namespace std; int main() { pair data(
我收到错误:'(Int, Int)' 与 'CGPoint' 不相同 如何将 (Int, Int) 转换为 CGPoint let zigzag = [(100,100), (100,150)
我在 .cpp 文件中发现了以下代码。我不理解涉及头文件的构造或语法。我确实认识到这些特定的头文件与 Android NDK 相关。但是,我认为这个问题是关于 C++ 语法的一般问题。这些在某种程度上
我将这些输入到 Scala 解释器中: val a : Integer = 1; val b : Integer = a + 1; 我收到消息: :5: error: type mismatch;
C++:vector>v(size);当我试图打印出值时显示 0 作为值,但是当未声明 vector 大小时它显示正确的输出?为什么这样?例如: int x; cin>>x; vector>v(x);
我是一名优秀的程序员,十分优秀!