先列举几个牛逼的存在
- Tesseract OCR
- Google Vision API
- Amazon Textract
- Microsoft Azure OCR
- ABBYY FineReader
- JavaOCR
说一个可以离线的渣渣
Tesseract OCR
1 | <!-- Maven依赖 --> |
翻译出来的内容有点人眼难懂
再说一个看起来还不错的离线方案
UmiOCR
- 免费:本项目所有代码开源,完全免费。
- 方便:解压即用,离线运行,无需网络。
- 高效:自带高效率的离线OCR引擎,内置多种语言识别库。
- 灵活:支持命令行、HTTP接口等外部调用方式。
- 功能:截图OCR / 批量OCR / PDF识别 / 二维码
思路
开启服务 使用java以http的方式调用识别ocr返回结果
Umi-OCR: Umi-OCR 是一款免费、开源、可批量的离线 OCR 软件,基于 PaddleOCR,适用于 Windows10/11 平台