OpenCV中直方图反向投影算法详解与实现
时间:2022-05-07
本文章向大家介绍OpenCV中直方图反向投影算法详解与实现,主要内容包括OpenCV中直方图反向投影算法详解与实现、一:直方图交叉、二:直方图反向投影、计算输入图像与模型的直方图代码如下、第二步:计算R、第三步:计算概率分布图像、第四步:卷积计算、第五步:归一化与显示反向投影结果、四:运行演示、基本概念、基础应用、原理机制和需要注意的事项等,并结合实例形式分析了其使用技巧,希望通过本文能帮助到大家理解应用这部分内容。
OpenCV中直方图反向投影算法详解与实现
一:直方图交叉
OpenCV中直方图反向投影算法实现来自一篇论文《Indexing Via Color Histograms》其作者有两位、是Michael.J.Swain与Dana H. Ballard。论文分为两个部分,前面一部分详细描述了颜色直方图以及通过颜色直方图交叉来实现对象鉴别。可以实现对象背景区分、复杂场景中查找对象、不同光照条件影响等。假设M表示模型直方图数据、I表示图像直方图数据、直方图交叉匹配可以被描述为如下:
其中J表示直方图的范围,即bin的个数。最终得到结果是表示多少个模型颜色像素与图像中的像素相同或者相似,值越大,表示越相似。归一化表示如下:
这种方法对背景像素变换可以保持稳定性、同时对尺度变换也有一定抗干扰作用,但是无法做到尺度不变性特征。基于上述理论,两位作者发现通过该方法可以定位图像中已知物体的位置,它们把这个方法叫做直方图反向投影(Back Projection)。
二:直方图反向投影
直方图反向投影可以通过如下步骤完成
- 对每个直方图BIN J
- 对图像的每个像素点I(x,y)根据像素值获得对应的直方图分布概率
- 对得到分布概率图像做卷积
- 求取局部最大值,即得到已知物体位置信息
正是因为直方图反向投影有这样能力,所以在经典的MeanShift与CAMeanShift跟踪算法中一直是通过直方图反向投影来实现已知对象物体的定位。
三:基于OpenCV算法代码实现
算法实现基于OpenCV的数据结构Mat来实现数据转换与存储,其它的地方基本都是自己写,上次有同学说我的代码都是Java的,这次全部改为C++啦,所以请大家继续关注本公众号!
第一步:直方图计算
OpenCV自己实现通过对直方图插值实现LUT查找,不做RGB颜色降维,本人的实现反其道而行之,对图像颜色做降维得到直方图,不再对直方图计算使用LUT插值查找。
void calculate_histogram(Mat &image, Mat &hist) { int width = image.cols; int height = image.rows; int r = 0, g = 0, b = 0; int index = 0; int level = 256 / bins; for (int row = 0; row < height; row++) { uchar* current = image.ptr<uchar>(row); for (int col = 0; col < width; col++) { if (image.channels() == 3) { b = *current++; g = *current++; r = *current++; index = (r / level) + (g / level)*bins + (b / level)*bins*bins; } if (image.channels() == 1) { r = *current++; index = (r / level); } hist.at<int>(index, 0)++; } }}
计算输入图像与模型的直方图代码如下
Mat mHist = Mat::zeros(total, 1, CV_32SC1);Mat iHist = Mat::zeros(total, 1, CV_32SC1);calculate_histogram(model, mHist);calculate_histogram(src, iHist);
第二步:计算R
Mat rhist = Mat::zeros(total, 1, CV_32FC1);float m = 0, t = 0;for (int i = 0; i < total; i++) { m = mHist.at<int>(i, 0); t = iHist.at<int>(i, 0); rhist.at<float>(i, 0) = m / t;}
第三步:计算概率分布图像
// 查找权重概率分布int r = 0, g = 0, b = 0;int level = 256 / bins;int index = 0;Mat w = Mat::zeros(src.size(), CV_32FC1);for (int row = 0; row < src.rows; row++) { uchar* current = src.ptr<uchar>(row); for (int col = 0; col < src.cols; col++) { if (src.channels() == 3) { b = *current++; g = *current++; r = *current++; index = (r / level) + (g / level)*bins + (b / level)*bins*bins; w.at<float>(row, col) = rhist.at<float>(index, 0); } else { r = *current++; index = (r / level); w.at<float>(row, col) = rhist.at<float>(index, 0); } }}
第四步:卷积计算
Mat dst;Mat kernel = (Mat_<float>(3, 3) << 1, 1, 1, 1, 1, 1, 1, 1, 1);filter2D(w, dst, -1, kernel);
第五步:归一化与显示反向投影结果
Mat result;normalize(dst, result, 0, 255, NORM_MINMAX);imshow("BackProjection Demo", result);
四:运行演示
模型图像
已知目标图像
反向投影结果
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- python第十六课——外部函数and内部函数
- python第十七课——列表生成式
- python第十八课——常用内置函数
- python第十九课——random模块中的常用函数
- python第二十课——math模块中常用的函数
- python第二十一课——str中的常用函数(重要)
- python第二十二课——list函数
- python第二十三课——dict中的函数
- python第二十四课——set中的函数
- python第二十五课——闭包
- LNMP架构应用实战——PHP扩展及缓存插件安装
- python第二十六课——装饰器
- LNMP架构应用实战——openssl升级最新版本
- python第二十七课——os模块
- python第二十八课——编码小常识