- ubuntu12.04环境下使用kvm ioctl接口实现最简单的虚拟机
- Ubuntu 通过无线网络安装Ubuntu Server启动系统后连接无线网络的方法
- 在Ubuntu上搭建网桥的方法
- ubuntu 虚拟机上网方式及相关配置详解
CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.
这篇CFSDN的博客文章python多进程读图提取特征存npy由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.
本文实例为大家分享了python多进程读图提取特征存npy的具体代码,供大家参考,具体内容如下 。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
|
import
multiprocessing
import
os, time, random
import
numpy as np
import
cv2
import
os
import
sys
from
time
import
ctime
import
tensorflow as tf
image_dir
=
r
"D:/sxl/处理图片/汉字分类/train10/"
#图像文件夹路径
data_type
=
'test'
save_path
=
r
'E:/sxl_Programs/Python/CNN/npy/'
#存储路径
data_name
=
'Img10'
#npy文件名
char_set
=
np.array(os.listdir(image_dir))
#文件夹名称列表
np.save(save_path
+
'ImgShuZi10.npy'
,char_set)
#文件夹名称列表
char_set_n
=
len
(char_set)
#文件夹列表长度
read_process_n
=
1
#进程数
repate_n
=
4
#随机移动次数
data_size
=
1000000
#1个npy大小
shuffled
=
True
#是否打乱
#可以读取带中文路径的图
def
cv_imread(file_path,
type
=
0
):
cv_img
=
cv2.imdecode(np.fromfile(file_path,dtype
=
np.uint8),
-
1
)
# print(file_path)
# print(cv_img.shape)
# print(len(cv_img.shape))
if
(
type
=
=
0
):
if
(
len
(cv_img.shape)
=
=
3
):
cv_img
=
cv2.cvtColor(cv_img, cv2.COLOR_BGR2GRAY)
return
cv_img
#多个数组按同一规则打乱数据
def
ShuffledData(features,labels):
'''
@description:随机打乱数据与标签,但保持数据与标签一一对应
'''
permutation
=
np.random.permutation(features.shape[
0
])
shuffled_features
=
features[permutation,:]
#多维
shuffled_labels
=
labels[permutation]
#1维
return
shuffled_features,shuffled_labels
#函数功能:简单网格
#函数要求:1.无关图像大小;2.输入图像默认为灰度图;3.参数只有输入图像
#返回数据:1x64*64维特征
def
GetFeature(image):
#图像大小归一化
image
=
cv2.resize(image,(
64
,
64
))
img_h
=
image.shape[
0
]
img_w
=
image.shape[
1
]
#定义特征向量
feature
=
np.zeros(img_h
*
img_w,dtype
=
np.int16)
for
h
in
range
(img_h):
for
w
in
range
(img_w):
feature[h
*
img_h
+
w]
=
image[h,w]
return
feature
# 写数据进程执行的代码:
def
read_image_to_queue(queue):
print
(
'Process to write: %s'
%
os.getpid())
for
j,dirname
in
enumerate
(char_set):
# dirname 是文件夹名称
label
=
np.where(char_set
=
=
dirname)[
0
][
0
]
#文件夹名称对应的下标序号
print
(
'序号:'
+
str
(j),
'读 '
+
dirname
+
' 文件夹...时间:'
,ctime() )
for
parent,_,filenames
in
os.walk(os.path.join(image_dir,dirname)):
for
filename
in
filenames:
if
(filename[
-
4
:]!
=
'.jpg'
):
continue
image
=
cv_imread(os.path.join(parent,filename),
0
)
# cv2.imshow(dirname,image)
# cv2.waitKey(0)
queue.put((image,label))
for
i
in
range
(read_process_n):
queue.put((
None
,
-
1
))
print
(
'读图结束!'
)
return
True
# 读数据进程执行的代码:
def
extract_feature(queue,lock,count):
'''
@description:从队列中取出图片进行特征提取
@queue:先进先出队列
lock:锁,在计数时上锁,防止冲突
count:计数
'''
print
(
'Process %s start reading...'
%
os.getpid())
global
data_n
features
=
[]
#存放提取到的特征
labels
=
[]
#存放标签
flag
=
True
#标志着进程是否结束
while
flag:
image,label
=
queue.get()
#从队列中获取图像和标签
if
len
(features) >
=
data_size
or
label
=
=
-
1
:
#特征数组的长度大于指定长度,则开始存储
array_features
=
np.array(features)
#转换成数组
array_labels
=
np.array(labels)
array_features,array_labels
=
ShuffledData(array_features,array_labels)
#打乱数据
lock.acquire()
# 锁开始
# 拆分数据为训练集,测试集
split_x
=
int
(array_features.shape[
0
]
*
0.8
)
train_data, test_data
=
np.split(array_features, [split_x], axis
=
0
)
# 拆分特征数据集
train_labels, test_labels
=
np.split(array_labels, [split_x], axis
=
0
)
# 拆分标签数据集
count.value
+
=
1
#下标计数加1
str_features_name_train
=
data_name
+
'_features_train_'
+
str
(count.value)
+
'.npy'
str_labels_name_train
=
data_name
+
'_labels_train_'
+
str
(count.value)
+
'.npy'
str_features_name_test
=
data_name
+
'_features_test_'
+
str
(count.value)
+
'.npy'
str_labels_name_test
=
data_name
+
'_labels_test_'
+
str
(count.value)
+
'.npy'
lock.release()
# 锁释放
np.save(save_path
+
str_features_name_train,train_data)
np.save(save_path
+
str_labels_name_train,train_labels)
np.save(save_path
+
str_features_name_test,test_data)
np.save(save_path
+
str_labels_name_test,test_labels)
print
(os.getpid(),
'save:'
,str_features_name_train)
print
(os.getpid(),
'save:'
,str_labels_name_train)
print
(os.getpid(),
'save:'
,str_features_name_test)
print
(os.getpid(),
'save:'
,str_labels_name_test)
features.clear()
labels.clear()
if
label
=
=
-
1
:
break
# 获取特征向量,传入灰度图
feature
=
GetFeature(image)
features.append(feature)
labels.append(label)
# # 随机移动4次
# for itime in range(repate_n):
# rMovedImage = randomMoveImage(image)
# feature = SimpleGridFeature(rMovedImage) # 简单网格
# features.append(feature)
# labels.append(label)
print
(
'Process %s is done!'
%
os.getpid())
if
__name__
=
=
'__main__'
:
time_start
=
time.time()
# 开始计时
# 父进程创建Queue,并传给各个子进程:
image_queue
=
multiprocessing.Queue(maxsize
=
1000
)
#队列
lock
=
multiprocessing.Lock()
#锁
count
=
multiprocessing.Value(
'i'
,
0
)
#计数
#将图写入队列进程
write_sub_process
=
multiprocessing.Process(target
=
read_image_to_queue, args
=
(image_queue,))
read_sub_processes
=
[]
#读图子线程
for
i
in
range
(read_process_n):
read_sub_processes.append(
multiprocessing.Process(target
=
extract_feature, args
=
(image_queue,lock,count))
)
# 启动子进程pw,写入:
write_sub_process.start()
# 启动子进程pr,读取:
for
p
in
read_sub_processes:
p.start()
# 等待进程结束:
write_sub_process.join()
for
p
in
read_sub_processes:
p.join()
time_end
=
time.time()
time_h
=
(time_end
-
time_start)
/
3600
print
(
'用时:%.6f 小时'
%
time_h)
print
(
"读图提取特征存npy,运行结束!"
)
|
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持我.
原文链接:https://blog.csdn.net/sxlsxl119/article/details/89340318 。
最后此篇关于python多进程读图提取特征存npy的文章就讲到这里了,如果你想了解更多关于python多进程读图提取特征存npy的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。
我是 Linux 的新手,并且继承了保持我们的单一 Linux 服务器运行的职责。这是我们的SVN服务器,所以比较重要。 原来在我之前维护它的人有一个 cron 任务,当有太多 svnserve 进程
Node 虽然自身存在多个线程,但是运行在 v8 上的 JavaScript 是单线程的。Node 的 child_process 模块用于创建子进程,我们可以通过子进程充分利用 CPU。范例:
Jenkins 有这么多进程处于事件状态是否正常? 我检查了我的设置,我只配置了 2 个“执行者”... htop http://d.pr/i/RZzG+ 最佳答案 您不仅要限制 Master 中的执
我正在尝试在 scala 中运行这样的 bash 命令: cat "example file.txt" | grep abc Scala 有一个特殊的流程管道语法,所以这是我的第一个方法: val f
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
我需要一些帮助来理解并发编程的基础知识。事实上,我读得越多,就越感到困惑。因此,我理解进程是顺序执行的程序的一个实例,并且它可以由一个或多个线程组成。在单核CPU中,一次只能执行一个线程,而在多核CP
我的问题是在上一次集成测试后服务器进程没有关闭。 在integration.rs中,我有: lazy_static! { static ref SERVER: Arc> = {
我正在使用 Scala scala.sys.process图书馆。 我知道我可以用 ! 捕获退出代码和输出 !!但是如果我想同时捕获两者呢? 我看过这个答案 https://stackoverflow
我正在开发一个C++类(MyClass.cpp),将其编译为动态共享库(MyClass.so)。 同一台Linux计算机上运行的两个不同应用程序将使用此共享库。 它们是两个不同的应用程序。它不是多线程
我在我的 C 程序中使用 recvfrom() 从多个客户端接收 UDP 数据包,这些客户端可以使用自定义用户名登录。一旦他们登录,我希望他们的用户名与唯一的客户端进程配对,这样服务器就可以通过数据包
如何更改程序,以便函数 function_delayed_1 和 function_delayed_2 仅同时执行一次: int main(int argc, char *argv[]) {
考虑这两个程序: //in #define MAX 50 int main(int argc, char* argv[]) { int *count; int fd=shm
请告诉我如何一次打开三个终端,这样我的项目就可以轻松执行,而不必打开三个终端三次然后运行三个exe文件。请问我们如何通过脚本来做到这一点,即打开三个终端并执行三个 exe 文件。 最佳答案 在后台运行
我编写了一个监控服务来跟踪一组进程,并在服务行为异常、内存使用率高、超出 CPU 运行时间等时发出通知。 这在我的本地计算机上运行良好,但我需要它指向远程机器并获取这些机器上的进程信息。 我的方法,在
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 想改进这个问题?将问题更新为 on-topic对于堆栈溢出。 8年前关闭。 Improve this qu
我有一个允许用户上传文件的应用程序。上传完成后,必须在服务器上完成许多处理步骤(解压、存储、验证等...),因此稍后会在一切完成后通过电子邮件通知用户。 我见过很多示例,其中 System.Compo
这个问题对很多人来说可能听起来很愚蠢,但我想对这个话题有一个清晰的理解。例如:当我们在 linux(ubuntu, x86) 上构建一个 C 程序时,它会在成功编译和链接过程后生成 a.out。 a.
ps -eaf | grep java 命令在这里不是识别进程是否是 java 进程的解决方案,因为执行此命令后我的许多 java 进程未在输出中列出。 最佳答案 简答(希望有人写一个更全面的): 获
我有几个与内核态和用户态的 Windows 进程相关的问题。 如果我有一个 hello world 应用程序和一个暴露新系统调用 foo() 的 hello world 驱动程序,我很好奇在内核模式下
我找不到很多关于 Windows 中不受信任的完整性级别的信息,对此有一些疑问: 是否有不受信任的完整性级别进程可以创建命名对象的地方? (互斥锁、事件等) 不受信任的完整性级别进程是否应该能够打开一
我是一名优秀的程序员,十分优秀!