Tesseract是一个开源的OCR(光学字符识别)引擎,用于识别并输出图片中的文字.虽然和商业软件比起来识别精度不算很高,但是如果你要寻找免费开源的OCR引擎,可能Tesseract就是唯一的选择了.Tesseract用起来还算是比较方便.它提供了一个简单的命令行工具,没有很多选项,输入图片输出就是文字.因为是开源的,你也可以直接编译使用它基于C++的库. 最近一段时间我对Python产生了很大的兴趣.它是如此的简洁高效,只要可以用Python完成的工作就懒得使用其他编程语言.所以到了应用Te