java代码实现图片内容转文字
时间:2019-12-03
本文章向大家介绍java代码实现图片内容转文字,主要包括java代码实现图片内容转文字使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
前言
现在的手机已经可以实现拍照转文字了。作为一名程序员,得使用java代码实现这一功能,虽然可能没啥用!!!
pom.xml
添加依赖
<dependency> <groupId>net.sourceforge.tess4j</groupId> <artifactId>tess4j</artifactId> <version>3.2.1</version> </dependency>
这个依赖有点东西啊,32M。
test.java
1 public static void main(String[] args) { 2 System.out.println("---------------------start--------------------------"); 3 Tesseract tesseract = new Tesseract(); 4 tesseract.setDatapath("D://DataScience//tessdata"); 5 // tesseract.setLanguage("chi_sim"); 6 try { 7 System.out.println(tesseract.doOCR(new File("C:\\Users\\caofei\\Desktop\\2.png"))); 8 } catch (TesseractException e) { 9 e.printStackTrace(); 10 } 11 12 System.out.println("----------------------end---------------------------"); 13 }
1.第三行,实例化一个Tesseract对象。
2.第四行,我们要实现这一功能,得需要光学字符识别工具,就像硬件设备一样(但不是真的设备,就是模型设置数据),我们要提供路径。
我下载了两个文件,eng前缀的代表英文的,chi_sim代表简体中文的。每一种语言对应一个。这些模型数据的下载地址
是:https://github.com/tesseract-ocr/tesseract/wiki/Data-Files
里面什么语言都有,也有这项技术的简介。
3.第七号,我准备的图片2.png
执行这个main方法,控制台就会输入我们想要的内容
4.第五号我注掉了,这个工具的默认语言是英文。
如果我们想转其他语言的图片,就需要像第五行这样指定。语言不匹配,会出现乱码。
原文地址:https://www.cnblogs.com/fengyuduke/p/11976234.html
- spring-data-mongodb之环境准备(1)
- java8 Lambda尝尝鲜
- spring-data-mongodb之批量更新操作
- spring-data-mongodb之Aggregation
- spring-data-mongodb之gridfs
- spring-data-mongodb之自增ID实现
- spring-data-mongodb之Repositor操作数据
- mongodb java操作语法
- spring-data-mongodb之查询操作
- spring mvc开发的mongodb网页版客户端
- nginx转发后后端怎么获取用户真实IP
- MongoDB aggregation $unwind
- spring data mongodb 代码连接数据库方式
- spring data mongodb dbref 关联查询
- java教程
- Java快速入门
- Java 开发环境配置
- Java基本语法
- Java 对象和类
- Java 基本数据类型
- Java 变量类型
- Java 修饰符
- Java 运算符
- Java 循环结构
- Java 分支结构
- Java Number类
- Java Character类
- Java String类
- Java StringBuffer和StringBuilder类
- Java 数组
- Java 日期时间
- Java 正则表达式
- Java 方法
- Java 流(Stream)、文件(File)和IO
- Java 异常处理
- Java 继承
- Java 重写(Override)与重载(Overload)
- Java 多态
- Java 抽象类
- Java 封装
- Java 接口
- Java 包(package)
- Java 数据结构
- Java 集合框架
- Java 泛型
- Java 序列化
- Java 网络编程
- Java 发送邮件
- Java 多线程编程
- Java Applet基础
- Java 文档注释
- 一看就懂的Tensorflow实战(K-Means模型)
- 一看就懂的Tensorflow实战(模型的保存与读取)
- 知识卡片 文本分词
- 一看就懂的Tensorflow实战(TensorBoard基础篇)
- 一看就懂的Tensorflow实战(TensorBoard高级篇)
- 一看就懂的Tensorflow实战(LSTM)
- 给我半首歌的时间,给你说明白Immutable List
- 一看就懂的Tensorflow实战(GAN)
- 一看就懂的Tensorflow实战(DCGAN)
- VBA解压缩ZIP文件08——解压-没有压缩
- 一文教你搞懂C语言的Q格式
- 基础算法之排序算法
- C++核心准则E4,5:设计并构建不变量
- Selenium实际应用注入并执行Javascript语句
- 什么是Python的 “内存管理机制”