Node.js环境下Tesseract OCR的应用

介绍了如何在Node.js环境下使用Tesseract OCR进行光学字符识别。

安装要求

  • Tesseract 3.01 或更高版本
  • Node.js

安装步骤

  1. 安装 Tesseract:

    • Homebrew用户可使用以下命令安装: brew install tesseract --with-all-languages (安装所有语言包,可根据需要移除 --all-languages 选项)
    • 其他用户请参考 Tesseract 项目网站上的安装说明。
  2. 设置环境变量:

    • 如果未安装所有语言包,需要手动下载语言包至本地,并将 TESSDATA_PREFIX 环境变量设置为语言包所在目录。例如: bash export TESSDATA_PREFIX=~/Downloads/tessdata
  3. 安装 node-tesseract 模块: bash npm install node-tesseract

使用示例

var tesseract = require('node-tesseract');
zip 文件大小:8.89KB