有没有人知道用于拍摄图像并在其上执行图像识别的c库,以便它可以根据给定的字体和/或字体高度找到字母?即使是不允许你选择字体的那个也不错(例如:readLetters(
Image image).
解决方法
我最近一直在研究这个问题.你最好的只是Tesseract.如果您需要在OCR之上进行布局分析,而不是使用Ocropus(后者使用Tesseract进行OCR).布局分析是指能够检测图像上文本的位置,并进行线分割,块分割等操作.
我通过Tesseract实验找到了一些非常好的技巧,值得分享.基本上我不得不为图像做很多预处理.
>升级/缩小输入图像至300 dpi.
>从图像中删除颜色.灰度很好.我实际上使用了抖动阈值并使我的输入变为黑白.
>从图像中剪掉不必要的垃圾.
对于上面的所有三个,我使用netbpm(一组用于unix的图像处理工具)来指出我所需要的几乎100%的准确度.
如果你有一个高度自定义的字体并单独使用tesseract,你必须“训练”系统 – 基本上你必须提供一堆训练数据.这在tesseract-ocr网站上有详细记载.实际上,您为字体创建了一种新的“语言”,并使用-l参数传递它.
我发现的另一种训练机制是Ocropus使用nueral net(bpnet)训练.它需要大量的输入数据来构建良好的统计模型.
在调用Tesseract / Ocropus方面都是C.它不会像ReadLines(Image)那么简单,但有一个API可以查看.您也可以通过命令行调用.