OCR识别

先列举几个牛逼的存在

  1. Tesseract OCR
  2. Google Vision API
  3. Amazon Textract
  4. Microsoft Azure OCR
  5. ABBYY FineReader
  6. JavaOCR

说一个可以离线的渣渣

Tesseract OCR

1
2
3
4
5
6
<!-- Maven依赖 -->
<dependency>
<groupId>net.sourceforge.tess4j</groupId>
<artifactId>tess4j</artifactId>
<version>4.5.1</version>
</dependency>

翻译出来的内容有点人眼难懂

再说一个看起来还不错的离线方案

UmiOCR

  • 免费:本项目所有代码开源,完全免费。
  • 方便:解压即用,离线运行,无需网络。
  • 高效:自带高效率的离线OCR引擎,内置多种语言识别库。
  • 灵活:支持命令行、HTTP接口等外部调用方式。
  • 功能:截图OCR / 批量OCR / PDF识别 / 二维码

思路

开启服务 使用java以http的方式调用识别ocr返回结果

Umi-OCR: Umi-OCR 是一款免费、开源、可批量的离线 OCR 软件,基于 PaddleOCR,适用于 Windows10/11 平台