我有一个相当模糊的数学难题的432×432图像,不能自适应地阈值(取平均值5×5像素的块大小,然后减去2):
正如你所看到的,数字略有扭曲,其中有很多破裂,有几个5s融合成6s和6s到8s.此外,还有一吨噪音.为了固定噪音,我必须使用高斯模糊使图像变得模糊.然而,即使是相当大的高斯内核和自适应阈值blockSize(21×21,减去2)也无法消除所有的破坏并将数字融合在一起甚至更多:
我也尝试在阈值后扩大图像,这对增加blockSize有相似的效果;和sharpening the image,这样做并不多.我还应该尝试什么
解决方法
一个很好的解决方案是使用形态关闭来使亮度均匀,然后使用常规(非自适应)Otsu阈值:
// Divide the image by its morphologically closed counterpart Mat kernel = Imgproc.getStructuringElement(Imgproc.MORPH_ELLIPSE,new Size(19,19)); Mat closed = new Mat(); Imgproc.morphologyEx(image,closed,Imgproc.MORPH_CLOSE,kernel); image.convertTo(image,CvType.CV_32F); // divide requires floating-point Core.divide(image,image,1,CvType.CV_32F); Core.normalize(image,255,Core.NORM_MINMAX); image.convertTo(image,CvType.CV_8UC1); // convert back to unsigned int // Threshold each block (3x3 grid) of the image separately to // correct for minor differences in contrast across the image. for (int i = 0; i < 3; i++) { for (int j = 0; j < 3; j++) { Mat block = image.rowRange(144*i,144*(i+1)).colRange(144*j,144*(j+1)); Imgproc.threshold(block,block,-1,Imgproc.THRESH_BINARY_INV+Imgproc.THRESH_OTSU); } }
结果: