Node.js环境下Tesseract OCR的应用
介绍了如何在Node.js环境下使用Tesseract OCR进行光学字符识别。
安装要求
- Tesseract 3.01 或更高版本
- Node.js
安装步骤
-
安装 Tesseract:
- Homebrew用户可使用以下命令安装:
brew install tesseract --with-all-languages
(安装所有语言包,可根据需要移除--all-languages
选项) - 其他用户请参考 Tesseract 项目网站上的安装说明。
- Homebrew用户可使用以下命令安装:
-
设置环境变量:
- 如果未安装所有语言包,需要手动下载语言包至本地,并将
TESSDATA_PREFIX
环境变量设置为语言包所在目录。例如:bash export TESSDATA_PREFIX=~/Downloads/tessdata
- 如果未安装所有语言包,需要手动下载语言包至本地,并将
- 安装 node-tesseract 模块:
bash npm install node-tesseract
使用示例
var tesseract = require('node-tesseract');
8.89KB
文件大小:
评论区