- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
考虑以下代码
import timeit
import numpy as np
MyArray = np.empty((10000, 10000, 1))
print((MyArray.size, MyArray.shape, MyArray.dtype, np.isfortran(MyArray)))
print(timeit.timeit(lambda: MyArray[0], number=10000))
print(timeit.timeit(lambda: MyArray.take(0), number=10000))
MyTwoArrays = np.empty((10000, 10000, 2))
MyArray = np.split(MyTwoArrays, 2, axis=2)[0]
print((MyArray.size, MyArray.shape, MyArray.dtype, np.isfortran(MyArray)))
print(timeit.timeit(lambda: MyArray[0], number=10000))
print(timeit.timeit(lambda: MyArray.take(0), number=1))
及其在我系统上的输出:
(100000000, (10000, 10000, 1), dtype('float64'), False)
0.05690493136299911
0.06236779451013045
(100000000, (10000, 10000, 1), dtype('float64'), False)
0.0569617025453055
1.6303121549025763
MyArray
的两个版本具有相同的大小、形状、数据类型和数据顺序。尽管如此,与使用相同结果的简单索引或 numpy .take
使用“原生”numpy 数组。
这是为什么呢?我可以解决这个问题吗?
更新:
这似乎与 View 有关:MyArray = MyArray.copy()
解决了这个问题。尽管如此,我还是很想知道为什么 [0]
的运行速度一样快,而 numpy.take
的查看速度会变慢。
另一个更新:
我注意到减速取决于数组维度(不是数组维度的数量,而是数组元素的数量)。对于单个第 0 个元素,我实现了长达 8 秒的访问时间。我发现这是这个问题最令人惊讶的方面。无论 numpy.take 在内部做什么,我都看不出为什么当索引较大时这种额外的“间接级别”的计算速度应该较慢。
第三次更新:
根据 @hpaulj 的评论,MyArray.take(0)
和 MyArray[0]
不等价,这里是一个更正的代码示例。 (我凭借我的 MATLAB 直觉犯了那个错误,并一度停止验证我的最小示例。我不想替换原始示例,因为 hpaulj 的答案可能取决于它。)
import timeit
import numpy as np
for UseSplit in (True, False):
if UseSplit:
print("Using split")
MyDoubleArray = np.random.rand(5000, 5000, 2)
MyArray = np.split(MyDoubleArray, 2, axis=2)[0]
else:
print("Not using split")
MyArray = np.random.rand(5000, 5000, 1)
print((MyArray.size, MyArray.shape, MyArray.dtype, np.isfortran(MyArray)))
NumpyTaking = MyArray.take(0)
DirectIndexing = MyArray.item(0)
assert (NumpyTaking == DirectIndexing)
print("Take 1")
print(timeit.timeit(lambda: MyArray.take(0), number=1))
print("Index 1")
print(timeit.timeit(lambda: MyArray.item(0), number=1))
NumpyTaking = MyArray.take(0, axis=2)
DirectIndexing = MyArray[:, :, 0]
assert (NumpyTaking == DirectIndexing).all()
print("Take many")
print(timeit.timeit(lambda: MyArray.take(0, axis=2), number=1))
print("Index many")
print(timeit.timeit(lambda: MyArray[:, :, 0], number=1))
在我的(其他)系统上有这个输出:
Using split
(25000000, (5000, 5000, 1), dtype('float64'), False)
Take 1
0.2260607502818708
Index 1
2.1667747519799052e-05
Take many
0.44334302173084994
Index many
0.0005971935325195243
Not using split
(25000000, (5000, 5000, 1), dtype('float64'), False)
Take 1
2.851019410510247e-05
Index 1
2.0527339755549434e-05
Take many
0.13906132276656846
Index many
1.444516501325488e-05
最佳答案
这个答案有点长而且令人费解,但我认为关键是,MyArray[0]
是两种构造中的 View 。 MyArray.take
在第二种情况 (split
) 中复制一份。 copy
需要更长的时间。
这两个 Action 不等价:
In [302]: MyArray = np.ones((10000, 10000, 1))
In [303]: MyArray[0].shape
Out[303]: (10000, 1)
In [304]: MyArray.take(0).shape
Out[304]: ()
take
和 axis=None
(默认),对数组进行分解。指定轴返回与 MyArray[0,:,:]
相同的东西:
In [305]: MyArray.take(0,axis=0).shape
Out[305]: (10000, 1)
使用 ipython
timeit
(和 numpy 1.14)
In [306]: timeit MyArray[0].shape
425 ns ± 7.03 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)
In [307]: timeit MyArray.take(0).shape
1.25 µs ± 11.2 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)
In [308]: timeit MyArray.take(0,axis=0).shape
10.6 µs ± 22.2 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
我有点惊讶 take
如此之慢,尽管我从来没有觉得它是一个速度工具。相反,它为以下情况提供了便利:
In [311]: MyArray.take(0, axis=1).shape
Out[311]: (10000, 1)
In [313]: MyArray[:,0,:].shape
Out[313]: (10000, 1)
在代码中使用数字而不是冒号指定轴更容易。
however, it can be easier to use if you need elements along a given axis.
当我通过拆分构造 MyArray
时,take
时间变得更糟
In [321]: timeit MyArray[0].shape
422 ns ± 5.54 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)
In [322]: timeit MyArray.take(0).shape
713 ms ± 10.9 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
In [323]: timeit MyArray.take(0,axis=0).shape
705 ms ± 3.4 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
ravel
是这段额外时间的大部分时间。我认为 take
必须复制一份:
In [324]: timeit MyArray.ravel()
710 ms ± 19.1 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
构建步骤:np.ones((10000, 10000, 2))
花费的时间更长,而且我担心我会出现内存错误。我使用 ones
而不是 empty
来确保数组在使用前已完全分配。
这表明内存管理问题使时序复杂化。
数据缓冲区指针告诉我数组是否是 View :
In [334]: MyArray.__array_interface__['data']
Out[334]: (139737581203472, False)
In [335]: MyArray2.__array_interface__['data']
Out[335]: (139737581203472, False)
MyArray2
就像您的 MyTwoArrays
。所以拆分返回的是 View ,而不是副本。
但是 ravel
必须在 split case 中复制一份:
In [336]: MyArray.ravel().__array_interface__['data']
Out[336]: (139739981209616, False)
In [337]: MyArray2.ravel().__array_interface__['data']
Out[337]: (139737581203472, False)
查看索引与 take
的数据缓冲区:
In [343]: MyArray[0].__array_interface__['data']
Out[343]: (139737581203472, False)
In [344]: MyArray.take(0, axis=0).__array_interface__['data']
Out[344]: (34066048, False)
In [345]: MyArray.take(0).__array_interface__['data']
Out[345]: (33320032, False)
MyArray[0]
仍然是一个 View ,因此相对较快。
take
MyArray
是一个副本,有和没有轴
。
In [346]: timeit MyArray.copy()
701 ms ± 1.87 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
在第一种情况下,我可能应该返回并检查复制,但此 session 的内存负载正在拖累我的其余计算。
关于python - 当简单索引不是时,为什么 numpy.take 对 numpy.split 的结果很慢?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49879944/
我有一个 view我拖了一个UITableView在里面,还有 2 UIImageView s(第一个显示背景图像,第二个只是在 View 顶部显示一个非常小的标题和图像)。 它们都设置为 weak特
我尝试用 C# 编写简单的 PostgreSQL 查询。第一个 connection.open() 需要 20 秒。其他连接立即执行。 PGAdmin 工作也很慢。如果我打开“查看所有行”,它也需要大
我制作了一个 html5 视频播放器,我注意到如果当前播放的视频有点大,搜索时间会异常地长。 越接近终点,寻找的时间越长;独立于我之前是否去过那里/与当前时间点的距离有多近,或者我是否缓冲了整个视频。
我正在使用 MaterialDatePicker,但速度很慢。 public class MainActivity extends AppCompatActivity { MaterialDa
我想知道为什么 MyBatis 是 慢 在我的应用程序中。 对于 SELECT COUNT(*) ,所用时间为: 20 秒 - 第一个请求 2-3 秒 - 后续请求 缓存很可能使后续请求更快。 配置
我已经安装了一个默认的开箱即用的 FreeSwitch 实例,但是当我尝试进行内部调用(分机到分机)时,大约需要 12 秒才能建立调用并且我可以听到铃声。 当我查看日志时,我几乎立即看到了连接请求,但
我已经放弃了让它跑得更快的实际尝试。 我最大的问题是,当我插入 html 时,应用程序会变慢到爬行。我有一个进度条,我正在调用 QCoreApplication.processEvents() (顺便
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 9
Doxygen 在我们的代码库上运行大约需要 12 个小时。这主要是因为有很多代码要处理(约 1.5M 行)。然而,它很快就会接近我们无法进行夜间文档更新的地步,因为它们需要太长时间。我们已经不得不减
我正在重写我的旧渲染管道。我根据自己的喜好创建了一个非常精简的原型(prototype),令我震惊的是,我原来相当复杂且优化不佳的管道与 super 简单的原型(prototype)具有完全相同的性能
我想为我的网站使用 Gridster,但我需要使用“add_widget”命令添加很多小部件。我做了一个测试,我认为“add_widget”功能存在问题:网格越来越慢并且存在内存泄漏。 您可以在此视频
我有一份包含图表和表格的报告。 我正在使用 html2canvas与 jsPDF将此报告导出为 PDF 文件。 但是这个过程耗时很长,超过11000ms。 我尝试更改格式和质量,但没有任何效果。 请看
我正在查询大于时间戳的类的所有修订,使用: AuditReaderFactory .get(emf.createEntityManager()) .createQuery().forR
我最近想加速一个加密系统。而在这个系统中,它将使用mysql,因此它包括文件。 而且我发现系统运行缓慢并不是因为加解密,而是因为处理一些sql语句。 它将在运行时使用内存数据库,并使用 中的 mys
谁能看出为什么这需要大约 20 秒?我正在运行下面的代码以将 JSON 请求发布到本地服务器 192.168.1.127。 curl -H "Content-type: application/jso
我有两个表:Posts 和Tags,其中存储了用户发布的文章以及他们为文章附加的标签。 PostTags 表用于表示文章 ID 和标签 ID 的关系。结构如下: 帖子: id | title | au
一个我应该能够自己回答但我没有,而且在谷歌中也找不到任何答案的问题: 我有一个表,其中包含具有以下结构的 500 万行: CREATE TABLE IF NOT EXISTS `files_histo
以下查询在具有大约 50 万行的表上执行需要 20 多秒: SELECT images.id, images.user_id, images_locale.filename, extension, s
我正在使用 $.getJSON 来提取对象 list (100 个项目,不是一个大集合),但 XHR 调用需要 8-10 秒。 想了解我是否缺少某些内容或我可以采取哪些措施来加快我的计划? 最佳答案
在这段代码中,我从网站获取一个字符串并将其显示在标签上。在标签上显示字符串真的很慢!大约 10 秒。但是在控制台 println (date) 上打印字符串时是立即的。我该如何解决这个问题?
我是一名优秀的程序员,十分优秀!