Node.js环境下Tesseract OCR的应用
介绍了如何在Node.js环境下使用Tesseract OCR进行光学字符识别。
安装要求
- Tesseract 3.01 或更高版本
- Node.js
安装步骤
-
安装 Tesseract:
- Homebrew用户可使用以下命令安装:
brew install tesseract --with-all-languages(安装所有语言包,可根据需要移除--all-languages选项) - 其他用户请参考 Tesseract 项目网站上的安装说明。
- Homebrew用户可使用以下命令安装:
-
设置环境变量:
- 如果未安装所有语言包,需要手动下载语言包至本地,并将
TESSDATA_PREFIX环境变量设置为语言包所在目录。例如:bash export TESSDATA_PREFIX=~/Downloads/tessdata
- 如果未安装所有语言包,需要手动下载语言包至本地,并将
- 安装 node-tesseract 模块:
bash npm install node-tesseract
使用示例
var tesseract = require('node-tesseract');
文件大小:8.89KB
评论区