OCR - 图像文字识别(本地运行)
使用Tesseract.js从图像中提取文字。100%本地运行,无需API密钥。支持中文和英文。
快速开始
node {baseDir}/scripts/ocr.js /path/to/image.jpg
node {baseDir}/scripts/ocr.js /path/to/image.png --lang chi_sim
node {baseDir}/scripts/ocr.js /path/to/image.jpg --lang chi_tra+eng
选项
-
--lang <语言代码>: 语言代码(默认:chi_sim+eng)chi_sim- 简体中文chi_tra- 繁体中文eng- 英文- 使用
+连接:chi_sim+eng
-
--json: 输出为JSON格式而非纯文本
示例
# Recognize Chinese screenshot
node {baseDir}/scripts/ocr.js screenshot.png
# Recognize English document
node {baseDir}/scripts/ocr.js document.jpg --lang eng
# Mixed Chinese + English
node {baseDir}/scripts/ocr.js mixed.png --lang chi_sim+eng
说明
- 首次运行会下载语言数据(每种语言约20MB)
- 后续运行将使用本地缓存
- 在清晰、高对比度的图像上效果最佳
- 对于手写文本,识别准确率可能有所不同


微信扫一扫,打赏作者吧~
网友评论
最新评论