可以去Github查看tesseract-ocr的信息:
在写这篇随笔的时候(2018年8月21日)最新版本是3.05.01,下载地址是:下载好之后进行安装,我安装的过程中勾选了一个语言是“English-Middle”的,不过好像它默认就有英文和数字……
设置环境变量TESSDATA_PREFIX
为tesseract的安装位置,我这里是:D:\Program Files (x86)\Tesseract-OCR
。 并将其添加到环境变量PATH
中。 然后再命令行输入tesseract -v
查看是否安装成功。
PS C:\Users\zifeiy\Pictures> tesseract -vtesseract 3.05.02 leptonica-1.75.3 libgif 5.1.4 : libjpeg 8d (libjpeg-turbo 1.5.3) : libpng 1.6.34 : libtiff 4.0.9 : zlib 1.2.11 : libwebp 0.6.1 : libopenjp2 2.2.0
然后测试一下下面这张图片:
结果是:
PS C:\Users\zifeiy\Pictures> tesseract CheckCode.jpg stdoutWarning. Invalid resolution 0 dpi. Using 70 instead.0481
成功!