我正在阅读视频流.
我正在使用tesseract 3.01和我的字体的自定义培训文件.
这是我做的:
设置tesseract只是为了找到数字(0-9)
>收缩,歪斜和二值化图像>使用GetLines查找我想要文本的行> setRectangle只能识别我想要的行> getUTF8Text获取我的文本< - 仅此一项需要2-3秒 有没有建议加快这个过程?
在交叉编译时遇到一些问题,
对于getUTF8Text,我的时间约为1.2 – 0.8秒和0.3 – 0.2秒的图像预处理.
我做了一些测试
>二进制化和收缩0.7增加0.3秒但成本为0.1> chop_enable = 0对平均速度增益为0.1的速度几乎没有影响,如果分析,它对50%的cpu使用量计算
可用性的主要好处是使用setRectangle优化代码而不调用getUTF8Text如果我怀疑边界是不正确的.并通过检查一些字符串后处理收到字符串并应用一些算法来消除最常见的误解来自tesseract.
也许这对其他人有用.