基于OpenCV.Net连通域分析进行文本块分割
时间:2019-11-07
本文章向大家介绍基于OpenCV.Net连通域分析进行文本块分割,主要包括基于OpenCV.Net连通域分析进行文本块分割使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
上一次通过投影的方式进行了文本块分割,(见 https://www.cnblogs.com/BoyTNT/p/11812323.html )但这种方法有很大的局限性,要求分行清晰、不能有字符跨多行、不能倾斜,而且对噪声比较敏感。还是拿上一回的图片,但是我在上面加了一个比较大的字,得出的结果就有问题了:
可以看到,由于右下角大大的“测”字跨了多行,导致水平投影分行时就出错了。
本次换一种方法,基于连通性分析来做。简单讲,就是把图像做一定的膨胀操作,使得同一个字符的不同部分以及相邻字符相互重叠到一起,变成一个整体,然后再通过分析找到每一个独立的块,排除掉噪声,剩下的基本就是符合条件的结果了。
直接上代码,后面再分析:
using System; using System.Collections.Generic; using System.IO; using System.Text; using OpenCvSharp; using OpenCvSharp.Extensions; using OpenCvSharp.Utilities; namespace OpenCvTest { class Program { static void Main(string[] args) { //读入源文件 var src = IplImage.FromFile("source.jpg"); //转换到灰度图 var gray = Cv.CreateImage(src.Size, BitDepth.U8, 1); Cv.CvtColor(src, gray, ColorConversion.BgrToGray); //做一下膨胀,x与y方向都做,但系数不同 //使用了Erode方法,腐蚀操作,针对白色区域,所以等效于对文字进行了膨胀 var kernal = Cv.CreateStructuringElementEx(5, 2, 1, 1, ElementShape.Rect); Cv.Erode(gray, gray, kernal, 2); //二值化 Cv.Threshold(gray, gray, 0, 255, ThresholdType.BinaryInv | ThresholdType.Otsu); //检测连通域,每一个连通域以一系列的点表示,FindContours方法只能得到第一个域 var storage = Cv.CreateMemStorage(); CvSeq<CvPoint> contour = null; Cv.FindContours(gray, storage, out contour, CvContour.SizeOf, ContourRetrieval.CComp, ContourChain.ApproxSimple); var color = new CvScalar(0, 0, 255); //开始遍历 while (contour != null) { //得到这个连通区域的外接矩形 var rect = Cv.BoundingRect(contour); //如果高度不足,或者长宽比太小,认为是无效数据,否则把矩形画到原图上 if(rect.Height > 10 && (rect.Width * 1.0 / rect.Height) > 0.2) Cv.DrawRect(src, rect, color); //取下一个连通域 contour = contour.HNext; } Cv.ReleaseMemStorage(storage); //显示 Cv.ShowImage("Result", src); Cv.WaitKey(); Cv.DestroyAllWindows(); } } }
下面来一步一步分析。读入的原图是这样的:
转换到灰度图并膨胀处理后,已经可以大致看出同一文本块的多个字符已经连到一起了:
二值化后的图像:
做连通性分析后,原始分析出的结果是这样的:
Cv.DrawContours(src, contour, color, color, 1);
对每个连通域取外接矩形,得到的最终结果是这样的:
可以看到效果比之前好了很多,比较大的字可以作为独立的文本块被检测出来了。另外即使是同一行的文本块,也会有轻微的上下浮动,不再是绝对按行对齐了。
未经许可严禁转载。
原文地址:https://www.cnblogs.com/BoyTNT/p/11812562.html
- 发布一个锁定行列的一种方法。(实现Excel里的冻结窗格的功能)
- IoC+AOP的简单实现
- 使用了继承、多态还有工厂模式和反射,但是还是没有OO的感觉。[已经增加了实现的代码]
- OO——从不知到知道一点,从迷茫到豁然开朗 (迟来的我的2002到2007)
- 只在UnitTest和WebHost中的出现的关于LogicalCallContext的严重问题
- TEST LAB V8在线渗透实验室教程(三)
- CMQ请求域名
- 在Entity Framework中使用存储过程(一):实现存储过程的自动映射
- 在Entity Framework中使用存储过程(二):具有继承关系实体的存储过程如何定义?
- 表单控件的副产品——查询控件
- 表单控件续(1)——应用接口来简化和分散代码
- 通过自定义配置实现插件式设计
- 让IoC动态解析自定义配置(提供基于Unity的实现)
- 如何让ASP.NET默认的资源编程方式支持非.ResX资源存储
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- Python 列表 使用技巧
- 通过案例学Python之判断属相
- C语言经典习题100例(七)31-35
- C语言经典习题100例(八)36-40
- 学习笔记:一个MySQL实例有多个Activiti数据库问题
- C语言经典习题100例(九)41-45
- C语言入门系列之1.C语言概述和上机运行简单C程序
- 开发微信小程序,我为什么放弃 setData,使用 upData
- C语言入门系列之3.顺序程序设计和输入输出
- uniapp提交选中的性别的value值
- LeetCode 1422. 分割字符串的最大得分
- LeetCode 64. 最小路径和
- C语言入门系列之4.分支结构程序-关系、逻辑运算和if、switch语句
- LeetCode 62. 不同路径
- 在裸机上部署Pulsar集群 顶