- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我需要 float32
类型的 3 channel RBG 排序彩色图像,每个颜色 channel 的值在 [0.0, 1.0]
区间内。
这是我目前的解决方案:
def read_images(imagelist):
buffer = list()
for f in imagelist:
# load single image, convert to float32
img = cv2.imread(f).astype(np.float32)
# change interval from [0, 255] to [0.0, 1.0]
img /= 255.0
# leave out alpha channel, if any
if img.shape[2] == 4:
img = img[:, :, 0:3]
buffer.append(img)
return np.array(buffer)
之后,在图像处理程序中,我将 BGR 更改为 RGB 顺序(因为 cv2
的 imread
默认以 BGR 顺序读取图像)。
这个过程对于大型图像集来说非常耗时:我正在加载数千张图像进行预处理,然后将图像提供给一些在 TensorFlow 中实现的神经网络。
有没有办法提高这种方法的性能?
最佳答案
使用这种方法,您可能无法做太多事情来加快图像读取速度。我想也许 Matplotlib 会更快,因为它直接读取为 float 和 RGB 顺序,但它的速度是 OpenCV 的三倍,即使在转换类型和 channel 顺序之后也是如此。 PIL 比 Matplotlib 快一点,但仍然是 OpenCV 的两倍,所以这无济于事,而 scikit-image 的速度与 PIL 大致相同:
import matplotlib.image as mpimg
import cv2
import numpy as np
from skimage import io
from PIL import Image
import timeit
times = range(1000)
# matplotlib
start_time = timeit.default_timer()
for t in times:
img = mpimg.imread('img1.png')
print("mpimg.imread(): ", timeit.default_timer() - start_time, "s")
# OpenCV
start_time = timeit.default_timer()
for t in times:
img = cv2.cvtColor(
cv2.imread('img1.png'), cv2.COLOR_BGR2RGB).astype(np.float32)/255.0
print("cv2.imread(): ", timeit.default_timer() - start_time, "s")
# scikit-image
start_time = timeit.default_timer()
for t in times:
img = io.imread('img1.png').astype(np.float32)/255.0
print("io.imread(): ", timeit.default_timer() - start_time, "s")
# PIL
start_time = timeit.default_timer()
for t in times:
img = np.asarray(Image.open('img1.png')).astype(np.float32)/255.0
print("Image.open(): ", timeit.default_timer() - start_time, "s")
mpimg.imread(): 37.68960806101677 s
cv2.imread(): 13.830177563999314 s
io.imread(): 29.395271296001738 s
Image.open(): 26.633562815986807 s
相反,通过读取所有图像并将它们保存为更好的读取格式(即直接从字节读取)而不是使用图像读取器来进行预处理可能会更好。您可以将图像序列化(pickle)为 .p
或 .pickle
文件,然后将数据直接加载到列表中。这样你只需要一次又一次地进行缓慢加载。作为Dan Mašek在下面的评论中注意,pickling 文件意味着将它们解压缩为原始数据,因此文件大小将大得多。您可以使用正确的类型和 channel 顺序创建与现在相同的列表(您的缓冲区),然后 pickle 列表;当需要训练时,您可以加载 pickle 文件;它方式更快,而且 super 简单:
with open(training_file, mode='rb') as f:
training_data = pickle.load(f)
关于python - OpenCV Python : fast solution for 3-channel float32 image reading?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45890171/
我的构建菜单包含两个构建选项: 构建解决方案 构建MyProjectName 如果我选择Build Solution(然后是Debug,Start Debugging (F5)),运行的可执行文件不包
我有一个带有一些输入字段的表单。这些输入字段具有指定的背景渐变,如下所示: input { background: #00b7ea; background: url(data:imag
现在这个遗留代码是多个项目,每个项目都有自己的解决方案。每个项目通过它编译的 dll 引用另一个项目。要让主项目运行,您必须以正确的顺序进行 10 多个单独的构建。 我试图解释如何将所有项目移动到一个
我在 Visual Studio 2013 中处理我的项目,我错误地点击了 Rebuild Solution。我收到以下异常,我不知道如何解决它。请建议。 Server Error in '/' Ap
class solution { void table(final int n) { for (int i = 1; i <= 10; i++) { S
我非常需要了解如何使用 Visual Studio 2010 在 c# 中管理一些非常基本的体系结构问题,而且我在教科书和网站上寻找解决方案时遇到了一些困难。假设我有一个 MyWinForm.sln
我有 Java 背景,正在尝试从 C# 开始。 我想用 C# 创建一个将在其他解决方案中使用的库。在 Eclipse 中,只需创建一个 jar 并将其添加到类路径中即可。我知道VS2013中的每个项目
在我目前的工作中,我需要打开 3 个不同的解决方案,构建并运行它们。是否有任何脚本可以像我单击 Web 服务的“构建解决方案”或“启动”或“Google Chrome”一样执行工作人员? 谢谢。 最佳
有什么方法可以告诉Visual Studio 2005的解决方案资源管理器在svn-checkout后第一次打开解决方案时不要扩展所有项目? 编辑: 感谢您指出 PowerCommands。当我使用带
我的 Visual Studio 解决方案的 Subversion 存储库中有以下目录: 项目名称 标签 分支机构 后备箱 我的解决方案.sln MyProject1(目录) MyProject2(目
我刚刚使用 Update 2 更新了 Visual Studio 2015。 现在,经过几个小时的正常工作,我收到:“检测到内存不足。对此解决方案禁用了完整的解决方案分析。”出现在我的 VS2015
在 Visual Studio Code 中,单击我的测试项目中的“调试测试”代码镜头链接: 导致错误信息: MSBUILD : error MSB1011: Specify which projec
我是Docker的新手,正在尝试为ASP.NET Core应用程序创建Dockerfile。有人可以建议我需要哪些更改吗? 这是我的Dockerfile: FROM microsoft/dotnet:
我的入门类(class)的这个实验要求我们以 pig 拉丁语返回任何用户输入。当我运行它并在控制台中输入任何字符串时,我似乎不断收到的错误是: java.lang.StringIndexOutO
关闭。这个问题需要更多focused .它目前不接受答案。 想改善这个问题吗?更新问题,使其仅关注一个问题 editing this post . 4年前关闭。 Improve this questi
关闭。这个问题是opinion-based .它目前不接受答案。 想改善这个问题吗?更新问题,以便可以通过 editing this post 用事实和引文回答问题. 11 个月前关闭。 Improv
我的 C++ Concert Cplex 有问题。我正在尝试重新创建最短路径问题。输出到文本文件是: Minimize obj: 2 x_12 + x_13 + 2 x_21 + x_24 + x_
有时,当我浏览我的头文件时,我想在 (doxygen) 文档中添加一些小东西。这可能是关于使用某些函数参数的快速说明,或者只是修复了一个小错字。 但后来我想:哦不,这会在下一个 make 调用时触发重
我正在使用缺少 findall 的高阶 Prolog 变体. 还有一个关于实现我们自己的问题 findall这里:Getting list of solutions in Prolog . 低效的实现
如果您的应用程序必须对大尺寸对象(> 85000 字节)进行大量分配/取消分配,则最终会导致内存碎片,并且您的应用程序将抛出内存不足异常。 这个问题有什么解决方案,还是CLR内存管理的限制? 最佳答案
我是一名优秀的程序员,十分优秀!