我有这个形象
如何OCR呢?
我知道这很有挑战性,但我真的很感激任何帮助.
解决方法
如果你有时间自己开发检测,我会大致这样做:
>获得1000张左右的照片,或者自己进行OCR,或者让亚马逊机械土耳其人为你做这件事,它几乎不需要任何费用.现在,您可以根据自己的需要调整算法并衡量自己的表现.
>像Ryan写的那样,手动或使用像http://www.roborealm.com/这样的标准图像滤镜,对比度,颜色,高斯等.看看你是否找不到使文本真正脱颖而出的组合.
>再次尝试库
>如果libs仍然不起作用,请尝试使用您对图片的了解将其拆分为单独的数字.你应该知道应该有多少位数,以及每个应该占多少像素.使用边缘检测或其他东西(可能是标准的OCR特征提取,以及聚类会将每个数字作为一个簇?)来查找数字并将它们分开.
>在每个数字上进行标准OCR特征提取(不要过于创新 – 使用现有的库或至少阅读最常见和最简单的内容)并将这些功能与1)中的答案一起提供给神经网络或SVM.
>改进您的功能集,直到机器学习工作.
由于您只有十个数字,这些数字在图像之间相当一致,因此应该可以使用.