- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在尝试使用均匀圆形 LBP(1 个单位半径邻域中的 8 个点)实现基本的人脸识别系统。我正在拍摄一张图片,将其大小调整为 200 x 200 像素,然后将图片拆分为 8x8 小图片。然后我计算每个小图像的直方图并获得直方图列表。为了比较 2 张图像,我计算相应直方图之间的卡方距离并生成分数。
这是我的统一 LBP 实现:
import numpy as np
import math
uniform = {0: 0, 1: 1, 2: 2, 3: 3, 4: 4, 5: 58, 6: 5, 7: 6, 8: 7, 9: 58, 10: 58, 11: 58, 12: 8, 13: 58, 14: 9, 15: 10, 16: 11, 17: 58, 18: 58, 19: 58, 20: 58, 21: 58, 22: 58, 23: 58, 24: 12, 25: 58, 26: 58, 27: 58, 28: 13, 29: 58, 30: 14, 31: 15, 32: 16, 33: 58, 34: 58, 35: 58, 36: 58, 37: 58, 38: 58, 39: 58, 40: 58, 41: 58, 42: 58, 43: 58, 44: 58, 45: 58, 46: 58, 47: 58, 48: 17, 49: 58, 50: 58, 51: 58, 52: 58, 53: 58, 54: 58, 55: 58, 56: 18, 57: 58, 58: 58, 59: 58, 60: 19, 61: 58, 62: 20, 63: 21, 64: 22, 65: 58, 66: 58, 67: 58, 68: 58, 69: 58, 70: 58, 71: 58, 72: 58, 73: 58, 74: 58, 75: 58, 76: 58, 77: 58, 78: 58, 79: 58, 80: 58, 81: 58, 82: 58, 83: 58, 84: 58, 85: 58, 86: 58, 87: 58, 88: 58, 89: 58, 90: 58, 91: 58, 92: 58, 93: 58, 94: 58, 95: 58, 96: 23, 97: 58, 98: 58, 99: 58, 100: 58, 101: 58, 102: 58, 103: 58, 104: 58, 105: 58, 106: 58, 107: 58, 108: 58, 109: 58, 110: 58, 111: 58, 112: 24, 113: 58, 114: 58, 115: 58, 116: 58, 117: 58, 118: 58, 119: 58, 120: 25, 121: 58, 122: 58, 123: 58, 124: 26, 125: 58, 126: 27, 127: 28, 128: 29, 129: 30, 130: 58, 131: 31, 132: 58, 133: 58, 134: 58, 135: 32, 136: 58, 137: 58, 138: 58, 139: 58, 140: 58, 141: 58, 142: 58, 143: 33, 144: 58, 145: 58, 146: 58, 147: 58, 148: 58, 149: 58, 150: 58, 151: 58, 152: 58, 153: 58, 154: 58, 155: 58, 156: 58, 157: 58, 158: 58, 159: 34, 160: 58, 161: 58, 162: 58, 163: 58, 164: 58, 165: 58, 166: 58, 167: 58, 168: 58, 169: 58, 170: 58, 171: 58, 172: 58, 173: 58, 174: 58, 175: 58, 176: 58, 177: 58, 178: 58, 179: 58, 180: 58, 181: 58, 182: 58, 183: 58, 184: 58, 185: 58, 186: 58, 187: 58, 188: 58, 189: 58, 190: 58, 191: 35, 192: 36, 193: 37, 194: 58, 195: 38, 196: 58, 197: 58, 198: 58, 199: 39, 200: 58, 201: 58, 202: 58, 203: 58, 204: 58, 205: 58, 206: 58, 207: 40, 208: 58, 209: 58, 210: 58, 211: 58, 212: 58, 213: 58, 214: 58, 215: 58, 216: 58, 217: 58, 218: 58, 219: 58, 220: 58, 221: 58, 222: 58, 223: 41, 224: 42, 225: 43, 226: 58, 227: 44, 228: 58, 229: 58, 230: 58, 231: 45, 232: 58, 233: 58, 234: 58, 235: 58, 236: 58, 237: 58, 238: 58, 239: 46, 240: 47, 241: 48, 242: 58, 243: 49, 244: 58, 245: 58, 246: 58, 247: 50, 248: 51, 249: 52, 250: 58, 251: 53, 252: 54, 253: 55, 254: 56, 255: 57}
def bilinear_interpolation(i, j, y, x, img):
fy, fx = int(y), int(x)
cy, cx = math.ceil(y), math.ceil(x)
# calculate the fractional parts
ty = y - fy
tx = x - fx
w1 = (1 - tx) * (1 - ty)
w2 = tx * (1 - ty)
w3 = (1 - tx) * ty
w4 = tx * ty
return w1 * img[i + fy, j + fx] + w2 * img[i + fy, j + cx] + \
w3 * img[i + cy, j + fx] + w4 * img[i + cy, j + cx]
def thresholded(center, pixels):
out = []
for a in pixels:
if a > center:
out.append(1)
else:
out.append(0)
return out
def uniform_circular(img, P, R):
ysize, xsize = img.shape
transformed_img = np.zeros((ysize - 2 * R,xsize - 2 * R), dtype=np.uint8)
for y in range(R, len(img) - R):
for x in range(R, len(img[0]) - R):
center = img[y,x]
pixels = []
for point in range(0, P):
r = R * math.cos(2 * math.pi * point / P)
c = R * math.sin(2 * math.pi * point / P)
pixels.append(bilinear_interpolation(y, x, r, c, img))
values = thresholded(center, pixels)
res = 0
for a in range(0, P):
res += values[a] << a
transformed_img.itemset((y - R,x - R), uniform[res])
transformed_img = transformed_img[R:-R,R:-R]
return transformed_img
我在 AT&T database 上做了一个实验每个主题拍摄 2 张图库图像和 8 张探测图像。实验的 ROC 结果是:
在上述 ROC 中,x 轴表示错误接受率,y 轴表示真实接受率。根据统一 LBP 标准,准确性似乎很差。我确定我的实现有问题。如果有人可以帮助我,那就太好了。感谢阅读。
编辑:
我想我在上面的代码中犯了一个错误。我顺时针方向走,而关于 LBP 的论文建议我在分配权重时应该逆时针方向走。行:c = R * math.sin(2 * math.pi * point/P)
应该是 c = -R * math.sin(2 * math.pi * point/P)
。编辑后的结果更糟。这表明我的代码有问题。我想我选择插值坐标的方式搞砸了。
编辑:接下来我尝试复制@bytefish 的代码here并使用uniform hashmap实现Uniform Circular LBP。
def uniform_circular(img, P, R):
ysize, xsize = img.shape
transformed_img = np.zeros((ysize - 2 * R,xsize - 2 * R), dtype=np.uint8)
for point in range(0, P):
x = R * math.cos(2 * math.pi * point / P)
y = -R * math.sin(2 * math.pi * point / P)
fy, fx = int(y), int(x)
cy, cx = math.ceil(y), math.ceil(x)
# calculate the fractional parts
ty = y - fy
tx = x - fx
w1 = (1 - tx) * (1 - ty)
w2 = tx * (1 - ty)
w3 = (1 - tx) * ty
w4 = tx * ty
for i in range(R, ysize - R):
for j in range(R, xsize - R):
t = w1 * img[i + fy, j + fx] + w2 * img[i + fy, j + cx] + \
w3 * img[i + cy, j + fx] + w4 * img[i + cy, j + cx]
center = img[i,j]
pixels = []
res = 0
transformed_img[i - R,j - R] += (t > center) << point
for i in range(R, ysize - R):
for j in range(R, xsize - R):
transformed_img[i - R,j - R] = uniform[transformed_img[i - R,j - R]]
这是相同的 ROC:
我尝试用 C++ 实现相同的代码。这是代码:
#include <stdio.h>
#include <stdlib.h>
#include <opencv2/opencv.hpp>
using namespace cv;
int* uniform_circular_LBP_histogram(Mat& src) {
int i, j;
int radius = 1;
int neighbours = 8;
Size size = src.size();
int *hist_array = (int *)calloc(59,sizeof(int));
int uniform[] = {0,1,2,3,4,58,5,6,7,58,58,58,8,58,9,10,11,58,58,58,58,58,58,58,12,58,58,58,13,58,14,15,16,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,17,58,58,58,58,58,58,58,18,58,58,58,19,58,20,21,22,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,23,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,24,58,58,58,58,58,58,58,25,58,58,58,26,58,27,28,29,30,58,31,58,58,58,32,58,58,58,58,58,58,58,33,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,34,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,35,36,37,58,38,58,58,58,39,58,58,58,58,58,58,58,40,58,58,58,58,58,58,58,58,58,58,58,58,58,58,58,41,42,43,58,44,58,58,58,45,58,58,58,58,58,58,58,46,47,48,58,49,58,58,58,50,51,52,58,53,54,55,56,57};
Mat dst = Mat::zeros(size.height - 2 * radius, size.width - 2 * radius, CV_8UC1);
for (int n = 0; n < neighbours; n++) {
float x = static_cast<float>(radius) * cos(2.0 * M_PI * n / static_cast<float>(neighbours));
float y = static_cast<float>(radius) * -sin(2.0 * M_PI * n / static_cast<float>(neighbours));
int fx = static_cast<int>(floor(x));
int fy = static_cast<int>(floor(y));
int cx = static_cast<int>(ceil(x));
int cy = static_cast<int>(ceil(x));
float ty = y - fy;
float tx = y - fx;
float w1 = (1 - tx) * (1 - ty);
float w2 = tx * (1 - ty);
float w3 = (1 - tx) * ty;
float w4 = 1 - w1 - w2 - w3;
for (i = 0; i < 59; i++) {
hist_array[i] = 0;
}
for (i = radius; i < size.height - radius; i++) {
for (j = radius; j < size.width - radius; j++) {
float t = w1 * src.at<uchar>(i + fy, j + fx) + \
w2 * src.at<uchar>(i + fy, j + cx) + \
w3 * src.at<uchar>(i + cy, j + fx) + \
w4 * src.at<uchar>(i + cy, j + cx);
dst.at<uchar>(i - radius, j - radius) += ((t > src.at<uchar>(i,j)) && \
(abs(t - src.at<uchar>(i,j)) > std::numeric_limits<float>::epsilon())) << n;
}
}
}
for (i = radius; i < size.height - radius; i++) {
for (j = radius; j < size.width - radius; j++) {
int val = uniform[dst.at<uchar>(i - radius, j - radius)];
dst.at<uchar>(i - radius, j - radius) = val;
hist_array[val] += 1;
}
}
return hist_array;
}
int main( int argc, char** argv )
{
Mat src;
int i,j;
src = imread( argv[1], 0 );
if( argc != 2 || !src.data )
{
printf( "No image data \n" );
return -1;
}
const int width = 200;
const int height = 200;
Size size = src.size();
Size new_size = Size();
new_size.height = 200;
new_size.width = 200;
Mat resized_src;
resize(src, resized_src, new_size, 0, 0, INTER_CUBIC);
int count = 1;
for (i = 0; i <= width - 8; i += 25) {
for (j = 0; j <= height - 8; j += 25) {
Mat new_mat = resized_src.rowRange(i, i + 25).colRange(j, j + 25);
int *hist = uniform_circular_LBP_histogram(new_mat);
int z;
for (z = 0; z < 58; z++) {
std::cout << hist[z] << ",";
}
std::cout << hist[z] << "\n";
count += 1;
}
}
return 0;
}
相同的 ROC:
我还做了一个基于排名的实验。并得到这条CMC曲线。
关于 CMC 曲线的一些细节:X 轴代表等级。 (1-10) 和 Y 轴表示精度 (0-1)。所以,我得到了 80% 以上的 Rank1 准确率。
最佳答案
我不知道 python,但很可能您的代码已损坏。
我的建议是,点击这两个链接,并尝试将其中一个 C++ 代码移植到 python。第一个链接还包含一些关于 LBP 的信息。
http://www.bytefish.de/blog/local_binary_patterns/
https://github.com/berak/uniform-lbp
还有一件事我可以说,你说你正在将图像调整为 200x200。你为什么要那样做?据我所知,AT&T 图片比那个小,你只是让图片变大,但我认为这不会帮助你,而且它可能会对性能产生负面影响。
关于c++ - Uniform Circular LBP人脸识别实现,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20581267/
环形缓冲区和循环链表有什么区别? Ring Buffer 的目的是什么,而循环链表不能,反之亦然? 最佳答案 环形缓冲区是一个连续的内存块,其中包含您的项目,当您到达终点时,您会循环回到起点: +--
我有一个像这样的多级依赖关系图,我需要检测该图中的任何循环引用。 A = B 乙=丙 C = [D, B] D = [C, A] 有人有这样的问题吗? 有什么解决办法??? 用英语表示感谢和抱歉。 =
尝试编写一个reduce函数来过滤掉任何重复项。我知道还有其他方法可以解决这个问题,但我正在尝试练习递归函数。 function addToSet(a, b) { a.add(b); retu
我想知道是否有人已经实现/知道(最好是 javascript)将处理循环间隔的间隔树算法。通过循环,我的意思是开始 > 结束的间隔。请注意,这也需要限制间隔的大小。 这只是常见区间树问题的一个子案例吗
我有一段代码,其中声明了两种数据类型。我已经将两者都自动派生为类型类 enum 的成员,但是,我不喜欢它们不是“圆形”的。我的意思是调用 succ Sun应该让我Mon . succ Dec应该导致
运行此代码时: function arrayToList(arr) { if (arr.length == 1) { return { value: arr[0],
我有以下模块结构: /components ├── Button.js ├── Checkbox.js ├── index.js ├── DateSelect ├── DateSelect.j
为了检查光线与三角形的碰撞,我们可以首先查看光线是否与三角形的平面发生碰撞。如果是,我们然后检查所有三角形边的交点是否在同一边。如果为真,则意味着该点位于三角形内部。此过程与矩形和其他凸图形类似。 这
我遇到了同样的问题,如下所示: NHibernate - not-null property reference a null or transient value 根本原因就像 Alun Harfo
我想以“循环”方式使用函数,如下例所示: fun cll1 (s)= cll2(s); fun cll2 (s)= cll3(s); fun cll3 (s)= cll(s); 编写此代码会在 SML
我想根据现有列的滞后值在 pyspark.sql.DataFrame 中创建一个新列。但是......我也希望最后一个值成为第一个值,第一个值成为最后一个值。这是一个例子: df = spark.cr
我正在使用 Microsoft.ServiceModel.Samples.CircularTracecListener 二进制文件来实现 Web 服务上的错误日志记录。 它应该写入一个文件,直到达到
我有一个由 8 个罗盘点组成的数组,从 SW 顺时针编号到 S: 2 3 4 1 5 0 7 6 我想计算从一点到另一点的最短路线是顺时针 (+1) 还是逆时针 (-1)。例如。从 7 到 5 是
我知道如何解决基本的循环依赖示例,有两个类,每个类都需要知道另一个存在。 但是,我现在的情况是,示例更复杂,前向声明不是可以解决该问题的东西。 考虑这三个文件 // my_thread.hpp tem
我正在开发一款用于在线播放歌曲的应用程序。我可以通过点击播放这首歌。 我的问题是我在所有 Activity 中都有一个 CircularSeekBar,我需要在所有屏幕上管理它。如果从任何 Activ
我正在尝试实现动画 shown here .它工作正常,除了 unreveal 动画,显示黑屏片刻。并非所有设备/api 版本都存在该故障。 Google Nexus 10 (API 22) 的 Ge
我正在使用 Canvas 创建倒数计时器循环,但有一个简单的问题,我需要将天数除以 364 天,当天数大于 364 天时,天数消失: 我需要的是这样的: (function($) { jQuery
我想在不使用 SVG 的情况下实现这样的效果: https://codepen.io/arforcee/pen/erbKi?limit=all&page=2&q=circular+loader 这是否
这个问题在这里已经有了答案: How to create a circle with links on border side (8 个答案) 关闭 4 年前。
我遇到了一个小设计问题。 如下情况 库界面 包含每个模型类的接口(interface)(仅限 getter 和 setter) 图书馆业务逻辑 包含接口(interface)库和 DAL 的实现。使用
我是一名优秀的程序员,十分优秀!