Tesseract 1.03OCR引擎
开源老版本的 OCR 引擎里,Tesseract 1.03算是个还挺能打的存在。虽然现在主流用的都是 4.x,但你要是遇上老项目维护,或者场景不复杂,它还是靠谱的。识别清晰图片的时候,准确率蛮高的,尤其对英文和中规中矩的版面,表现不错。安装配置也不难,用命令行一把梭基本就搞定了。
Windows、Linux、macOS都能跑,兼容性还行。语言支持虽然比不上后来的版本丰富,但主流语言都有,中文也能识别。核心识别方式是模板匹配+早期的机器学习,说白了就是识字规则比较死板,但稳定性还行。
平时用法就是下源码包tesseract-1.03.tar.gz
,编译后跑命令:
tesseract input.png output.txt
识别完做点文本校对
和简单清洗,效果会更好。
,图像要求比较高,模糊、倾斜、带噪点的就不太行了。还有像多栏排版、手写文字这种,别想太多,它不了,得你自己做前或找别的工具配合。
对比现在的 LSTM 那套深度模型,这个版本确实有点原始,但轻量、快,稳定,适合跑在老机器或资源紧张的场景。如果你是在维护老系统,或者想了解 OCR 基础原理,玩玩它还挺有意思。
对 OCR 感兴趣的,你也可以看看下面几个相关文章:
如果你是搞嵌入式、老系统兼容,或者只想识别一些扫描文档,Tesseract 1.03完全够用,不必追最新版。
2.7MB
文件大小:
评论区