目的

本节你将学到:

如何用Point在图像中定义 2D 点
如何以及为何使用Scalar
用OpenCV的函数 line绘直线
用OpenCV的函数 ellipse绘椭圆
用OpenCV的函数 rectangle绘矩形
用OpenCV的函数 circle绘圆
用OpenCV的函数 fillPoly绘填充的多边形

OpenCV 原理

本节中，我门将大量使用Point和Scalar这两个结构：

Point

次数据结构表示了由其图像坐标和指定的2D点。可定义为：

 
    Point pt;
pt.x = 10;
pt.y 8;

或者

Point pt =  Point(10, 8);
 
   

Scalar

表示了具有4个元素的数组。次类型在OpenCV中被大量用于传递像素值。
本节中，我们将进一步用它来表示RGB颜色值（三个参数）。如果用不到第四个参数，则无需定义。
我们来看个例子，如果给出以下颜色参数表达式：
```
Scalar( a, b, c )
```
那么定义的RGB颜色值为：Red = c,Green = bandBlue = a

代码分析

我们打算画两个例子（原子和赌棍），所以必须创建两个图像和对应的窗口以显示。

 
     /// 窗口名字
char atom_window[] = "Drawing 1: Atom";
char rook_window[] "Drawing 2: Rook";

/// 创建空全黑像素的空图像
Mat atom_image = Mat::zeros( w, w, CV_8UC3 );
Mat rook_image CV_8UC3 );
 
    

创建用来画不同几何形状的函数。比如用MyEllipse和MyFilledCircle来画原子。

/// 1. 画一个简单的原子。 /// 1.a. 创建椭圆 MyEllipse( atom_image,80)">90 ); MyEllipse( atom_image,80)">0 ); MyEllipse( atom_image,80)">45 ); MyEllipse( atom_image, -45 ); /// 1.b. 创建圆 MyFilledCircle( atom_image, Point( w/2.0, w2.0) );
接下来用MyLine*，*rectangle和 aMyPolygon来画赌棍：

/// 2. 画一个赌棍 /// 2.a. 创建一个凸多边形 MyPolygon( rook_image ); /// 2.b. 创建矩形 rectangle( rook_image, Point( 0,80)">7*w8.0 ), Point( w, w), Scalar( 255,80)">255 ), 1, 8 ); /// 2.c. 画几条直线 MyLine( rook_image, Point( 15/16 ), Point( w,80)">16 ) ); MyLine( rook_image,80)">4,80)">8 ), w ) ); MyLine( rook_image,80)">2,80)">3w ) );
现在来看看每个函数内部如何定义:
- MyLine
```
void MyLine( Mat img, Point start, Point end )
{
  int thickness 2;
  int lineType 8;
  line( img,
        start,
        end,
        Scalar( 0 ),
        thickness,
        lineType );
}
```
  正如我们所见,MyLine调用函数 line来实现以下操作:
  - 画一条从点start到点end的直线段
  - 此线段将被画到图像img上
  - 线的颜色由Scalar( 0,0)来定义，在此其相应RGB值为黑色
  - 线的粗细由thickness设定(此处设为 2)
  - 此线为8联通 (lineType= 8)
- MyEllipse
  
  void MyEllipse( Mat img, double angle ) { 8; ellipse( img, Point( w2.0 ), Size( w4.0,80)">16.0 ), angle,80)">360, thickness, lineType ); }
  
  根据以上代码，我们可看到函数 ellipse按照以下规则绘制椭圆：
  - 椭圆将被画到图像img上
  - 椭圆中心为点(w/2.0,w/2.0)并且大小位于矩形(w/4.0,w/16.0)内
  - 椭圆旋转角度为angle
  - 椭圆扩展的弧度从0度到360度
  - 图形颜色为Scalar( 255,0)，既蓝色
  - 绘椭圆的线粗为thickness，此处是2
- MyFilledCircle
  
  void MyFilledCircle( Mat img, Point center ) { = 1; 8; circle( img, center, w32.0, Scalar( thickness, lineType ); }
  
  类似于椭圆函数，我们可以看到circle函数的参数意义如下：
  - 圆将被画到图像 (img)上
  - 圆心由点center定义
  - 圆的半径为:w/32.0
  - 圆的颜色为:Scalar(0,255)，按BGR的格式为红色
  - 线粗定义为thickness= -1,因此次圆将被填充
- MyPolygon
```
void MyPolygon( Mat img )
{
  int lineType = 8;

  /** 创建一些点 */
  Point rook_points[1][20];
  rook_points[0][0] = Point( w/4.0,7*w/8.0 );
  rook_points[0][1] = Point( 3*w/4.0,7*w/8.0 );
  rook_points[0][2] = Point( 3*w/4.0,13*w/16.0 );
  rook_points[0][3] = Point( 11*w/16.0,13*w/16.0 );
  rook_points[0][4] = Point( 19*w/32.0,3*w/8.0 );
  rook_points[0][5] = Point( 3*w/4.0,3*w/8.0 );
  rook_points[0][6] = Point( 3*w/4.0,w/8.0 );
  rook_points[0][7] = Point( 26*w/40.0,w/8.0 );
  rook_points[0][8] = Point( 26*w/40.0,w/4.0 );
  rook_points[0][9] = Point( 22*w/40.0,w/4.0 );
  rook_points[0][10] = Point( 22*w/40.0,w/8.0 );
  rook_points[0][11] = Point( 18*w/40.0,w/8.0 );
  rook_points[0][12] = Point( 18*w/40.0,w/4.0 );
  rook_points[0][13] = Point( 14*w/40.0,w/4.0 );
  rook_points[0][14] = Point( 14*w/40.0,w/8.0 );
  rook_points[0][15] = Point( w/4.0,w/8.0 );
  rook_points[0][16] = Point( w/4.0,3*w/8.0 );
  rook_points[0][17] = Point( 13*w/32.0,3*w/8.0 );
  rook_points[0][18] = Point( 5*w/16.0,13*w/16.0 );
  rook_points[0][19] = Point( w/4.0,13*w/16.0) ;

  const Point* ppt[1] = { rook_points[0] };
  int npt[] = { 20 };

  fillPoly( img,ppt,npt,1,Scalar( 255,255 ),lineType );
 }


 我们用函数 :fill_poly:`fillPoly <>` 来绘制填充的多边形。请注意：
```
  - 多边形将被画到图像img上
  - 多边形的顶点集为ppt
  - 要绘制的多边形顶点数目为npt
  - 要绘制的多边形数量仅为1
  - 多边形的颜色定义为Scalar( 255,255),既BGR值为白色
- rectangle
  
  rectangle( rook_image,80)">8 );
  
  最后是函数:rectangle:rectangle <>（我们并没有为这家伙创建特定函数）。请注意：
  - 矩形将被画到图像rook_image上
  - 矩形两个对角顶点为Point( 0,7*w/8.0 )和Point( w,w)
  - 矩形的颜色为Scalar(0,255)，既BGR格式下的黄色
  - 由于线粗为-1,此矩形将被填充

结果

编译并运行例程，你将看到如下结果:

随机数发生器&绘制文字

目的

本节你将学到:

使用随机数发生器类(RNG) 并得到均匀分布的随机数。
通过使用函数 putText 显示文字。

代码

在之前的章节中 (基本绘图) 我们绘制过不同的几何图形,我提供了一些绘制参数，比如 coordinates（坐标） (在绘制点Points的时候 ),color（颜色）,thickness（线条-粗细，点-大小）,等等... ，你会发现我们给出了这些参数明确的数值。
在本章中,我们会试着赋予这些参数random随机的数值。并且,我们会试图在图像上绘制大量的几何图形. 因为我们将用随机的方式初始化这些图形,这个过程将很自然的用到loops循环.
本代码在OpenCV的sample文件夹下，如果招不到，你可以从这里here 得到它：.

说明

让我们检视main函数。我们发现第一步是实例化一个Random Number Generator（随机数发生器对象）(RNG):

RNG rng( 0xFFFFFFFF );

RNG的实现了一个随机数发生器。在上面的例子中,rng是用数值0xFFFFFFFF来实例化的一个RNG对象。
然后我们初始化一个0矩阵(代表一个全黑的图像),并且指定它的宽度，高度，和像素格式:

/// 初始化一个0矩阵 Mat image ::zeros( window_height, window_width, CV_8UC3 ); /// 把它会知道一个窗口中 imshow( window_name, image );
然后我们开始疯狂的绘制。看过代码时候你会发现它主要分八个部分，正如函数定义的一样：

/// 现在我们先画线 c = Drawing_Random_Lines(image, window_name, rng); if( c != 0 ) return 0; /// 继续，这次是一些矩形 c = Drawing_Random_Rectangles(image,144); font-style:italic">/// 画一些弧线 c = Drawing_Random_Ellipses( image, rng ); /// 画一些折线 c = Drawing_Random_Polylines( image,144); font-style:italic">/// 画被填充的多边形 c = Drawing_Random_Filled_Polygons( image,144); font-style:italic">/// 画圆 c = Drawing_Random_Circles( image,144); font-style:italic">/// 在随机的地方绘制文字 c = Displaying_Random_Text( image,144); font-style:italic">/// Displaying the big end! c = Displaying_Big_End( image, rng );

所有这些范数都遵循相同的模式，所以我们只分析其中的一组，因为这适用于所有。
查看函数Drawing_Random_Lines:

int Drawing_Random_Lines( Mat image,0)">char* window_name, RNG rng ) { 8; Point pt1, pt2; for( int i 0; i < NUMBER; i++ ) { pt1.x = rng.uniform( x_1, x_2 ); pt1.y = rng.uniform( y_1, y_2 ); pt2.x x_2 ); pt2.y y_2 ); line( image, pt1, pt2, randomColor(rng), rng.uniform(10),80)">8 ); imshow( window_name, image ); if( waitKey( DELAY ) >= 0 ) { return 1; } } 0; }

我们可以看到：
- for循环将重复NUMBER次。并且函数 line在循环中,这意味着要生成NUMBER条线段。
- 线段的两个端点分别是pt1和pt2. 对于pt1我们看到:
```
pt1.x x_2 );
pt1.y y_2 );
```
  - 我们知道rng是一个随机数生成器对象。在上面的代码中我们调用了rng.uniform(a,b)。这指定了一个在a和b之间的均匀分布(包含a,但不含b)。
  - 由上面的说明，我们可以推断出pt1和pt2将会是随机的数值，因此产生的线段是变幻不定的，这会产生一个很好的视觉效果（从下面绘制的图片可以看出）。
  - 我们还可以发现,在line的参数设置中，对于color的设置我们用了：
    randomColor(rng)
    让我们来看看函数的实现：
    
    static Scalar randomColor( RNG& rng ) { int icolor = (unsigned) rng; return Scalar( icolor&(icolor>>8)16)255 ); }
    
    正如我们看到的，函数的返回值是一个用三个随机数初始化的Scalar对象，这三个随机数代表了颜色的R,G,B分量。所以，线段的颜色也是随机的！
上面的解释同样适用于其它的几何图形，比如说参数center（圆心）和vertices（顶点）也是随机的。
在结束之前，我们还应该看看函数Display_Random_Text和Displaying_Big_End,因为它们有一些有趣的特征:
Display_Random_Text:

int Displaying_Random_Text( Mat image,80)">8; for ( 1; i ++ ) { Point org; org.x = rng.uniform(x_1, x_2); org.y = rng.uniform(y_1, y_2); putText( image, "Testing text rendering", org,8), rng.uniform(100)*0.05+0.1, lineType); imshow( window_name, image ); if( waitKey(DELAY) 0 ) { 1; } } 0; }

这些看起来都很熟悉，但是这一句：

putText( image, rng.uniform(lineType);

函数 putText都做了些什么？在我们的例子中：
- 在image上绘制文字“Testing text rendering”。
- 文字的左下角将用点org指定。
- 字体参数是用一个在
  $[0,8></p>$ 之间的整数来定义。
- 字体的缩放比例是用表达式rng.uniform(0,100)x0.05 + 0.1指定(表示它的范围是
  $[0.1,5.1></p>$ )。
- 字体的颜色是随机的 (记为randomColor(rng))。
- 字体的粗细范围是从 1 到 10,表示为rng.uniform(1,10)。
因此,我们将绘制 (与其余函数类似)NUMBER个文字到我们的图片上，以位置随机的方式。
Displaying_Big_End

int Displaying_Big_End( Mat image, RNG rng ) { Size textsize = getTextSize("OpenCV forever!", CV_FONT_HERSHEY_COMPLEX,80)">3,80)">5,80)">0); Point org((window_width - textsize.width)(window_height - textsize.height)2); 8; Mat image2; < 255; i += 2 ) { image2 = image - Scalar::all(i); putText( image2, Scalar(i, i,80)">255), lineType ); imshow( window_name, image2 ); 0; }

除了getTextSize(用于获取文字的大小参数),我们可以发现在for循环里的新操作：
```
  image2 = image - Scalar::all(i)

**image2** 是 **image** 和 **Scalar::all(i)** 的差。事实上，**image2** 的每个像素都是 **image** 的每个像素减去 **i** (对于每个像素，都是由R，G，B三个分量组成，每个分量都会独立做差)的差。
```

我们还要知道，减法操作总是保证是合理的操作,这表明结果总是在合理的范围内 (这个例子里结果不会为负数，并且保证在 0～255的合理范围内)。

结果

正如你在代码部分看到的,程序将依次执行不同的绘图函数，这将：

首先NUMBER条线段将出现在屏幕上，正如截图所示：
然后，一个新的图形，这次是一些矩形：
现在，一些弧线会出现，每一个弧线都有随机的位置，大小，边缘的粗细和弧长：
现在,带有三个参数的polylines（折线）将会出现在屏幕上，同样以随机的方式：
填充的多边形 (这里是三角形) 会出现.
最后出现的图形：圆
在结尾处,文字“Testing Text Rendering”将会以不同的字体，大小，颜色和位置出现在屏幕上。
最后 (这也顺便表达了OpenCV的宗旨):

离散傅立叶变换目标

本文档尝试解答如下问题：

什么是傅立叶变换及其应用?
如何使用OpenCV提供的傅立叶变换?
相关函数的使用，如：copyMakeBorder(),merge(),dft(),getOptimalDFTSize(),log()和normalize().

源码

你可以从此处下载源码或者通过OpenCV源码库文件samples/cpp/tutorial_code/core/discrete_fourier_transform/discrete_fourier_transform.cpp查看.

以下为函数 dft()使用范例:

 
    
     
       
      #include "opencv2/core/core.hpp"
#include "opencv2/imgproc/imgproc.hpp"
#include "opencv2/highgui/highgui.hpp"
#include <iostream>
int main(int argc,0)">char ** argv)
{
    const * filename = argc >=2 ? argv[1] : "lena.jpg";

    Mat I = imread(filename, CV_LOAD_IMAGE_GRAYSCALE);
    if( I.empty())
        1;
    
    Mat padded;                            //expand input image to optimal size
    int m = getOptimalDFTSize( I.rows );
    int n = getOptimalDFTSize( I.cols ); // on the border add zero values
    copyMakeBorder(I, padded, m - I.rows, n - I.cols, BORDER_CONSTANT, Scalar::all(0));

    Mat planes[] = {Mat_<float>(padded), Mat::zeros(padded.size(), CV_32F)};
    Mat complexI;
    merge(planes, complexI);         // Add to the expanded another plane with zeros

    dft(complexI, complexI);            // this way the result may fit in the source matrix

    // compute the magnitude and switch to logarithmic scale
    // => log(1 + sqrt(Re(DFT(I))^2 + Im(DFT(I))^2))
    split(complexI, planes);                   // planes[0] = Re(DFT(I),planes[1] = Im(DFT(I))
    magnitude(planes[0], planes[1],80)">0]);// planes[0] = magnitude  
    Mat magI = planes[0];
    
    magI += Scalar1);                    // switch to logarithmic scale
    log(magI, magI);

    // crop the spectrum,if it has an odd number of rows or columns
    magI = magI(Rect(magI.cols & magI.rows 2));

    // rearrange the quadrants of Fourier image  so that the origin is at the image center        
    int cx = magI.cols2;
    int cy = magI.rows2;

    Mat q0(magI, Rect(cx, cy));   // Top-Left - Create a ROI per quadrant 
    Mat q1(magI, Rect(cx, cy));  // Top-Right
    Mat q2(magI, cy,144); font-style:italic">// Bottom-Left
    Mat q3(magI, cy)); // Bottom-Right

    Mat tmp;                           // swap quadrants (Top-Left with Bottom-Right)
    q0.copyTo(tmp);
    q3.copyTo(q0);
    tmp.copyTo(q3);

    q1.copyTo(tmp);                    // swap quadrant (Top-Right with Bottom-Left)
    q2.copyTo(q1);
    tmp.copyTo(q2);

    normalize(magI, magI, CV_MINMAX); // Transform the matrix with float values into a 
                                            // viewable image form (float between values 0 and 1).

    imshow("Input Image"       , I   );    // Show the result
    imshow("spectrum magnitude", magI);    
    waitKey();

    0;
}
 
       
 
     
 
    
  

原理

对一张图像使用傅立叶变换就是将它分解成正弦和余弦两部分。也就是将图像从空间域(spatial domain)转换到频域(frequency domain)。这一转换的理论基础来自于以下事实：任一函数都可以表示成无数个正弦和余弦函数的和的形式。傅立叶变换就是一个用来将函数分解的工具。 2维图像的傅立叶变换可以用以下数学公式表达:

式中 f 是空间域(spatial domain)值， F 则是频域(frequency domain)值。转换之后的频域值是复数，因此，显示傅立叶变换之后的结果需要使用实数图像(real image) 加虚数图像(complex image),或者幅度图像(magitude image)加相位图像(phase image)。在实际的图像处理过程中，仅仅使用了幅度图像，因为幅度图像包含了原图像的几乎所有我们需要的几何信息。然而，如果你想通过修改幅度图像或者相位图像的方法来间接修改原空间图像，你需要使用逆傅立叶变换得到修改后的空间图像，这样你就必须同时保留幅度图像和相位图像了。

在此示例中，我将展示如何计算以及显示傅立叶变换后的幅度图像。由于数字图像的离散性，像素值的取值范围也是有限的。比如在一张灰度图像中，像素灰度值一般在0到255之间。因此，我们这里讨论的也仅仅是离散傅立叶变换(DFT)。如果你需要得到图像中的几何结构信息，那你就要用到它了。请参考以下步骤(假设输入图像为单通道的灰度图像I):

将图像延扩到最佳尺寸. 离散傅立叶变换的运行速度与图片的尺寸息息相关。当图像的尺寸是2， 3，5的整数倍时，计算速度最快。因此，为了达到快速计算的目的，经常通过添凑新的边缘像素的方法获取最佳图像尺寸。函数 getOptimalDFTSize()返回最佳尺寸，而函数 copyMakeBorder()填充边缘像素:

Mat padded; //将输入图像延扩到最佳的尺寸 = getOptimalDFTSize( I.rows ); // 在边缘添加0 copyMakeBorder(I,80)">0));

添加的像素初始化为0.
为傅立叶变换的结果(实部和虚部)分配存储空间. 傅立叶变换的结果是复数，这就是说对于每个原图像值，结果是两个图像值。此外，频域值范围远远超过空间值范围，因此至少要将频域储存在float格式中。结果我们将输入图像转换成浮点类型，并多加一个额外通道来储存复数部分：

Mat planes[] CV_32F)}; Mat complexI; merge(planes,144); font-style:italic">// 为延扩后的图像增添一个初始化为0的通道
进行离散傅立叶变换. 支持图像原地计算 (输入输出为同一图像):

dft(complexI,144); font-style:italic">// 变换结果很好的保存在原始矩阵中
将复数转换为幅度.复数包含实数部分(Re)和复数部分 (imaginary -Im)。离散傅立叶变换的结果是复数，对应的幅度可以表示为:

转化为OpenCV代码:

split(complexI,planes[1] = Im(DFT(I)) magnitude(planes[// planes[0] = magnitude Mat magI 0];

@H_616_3010@

对数尺度(logarithmic scale)缩放. 傅立叶变换的幅度值范围大到不适合在屏幕上显示。高值在屏幕上显示为白点，而低值为黑点，高低值的变化无法有效分辨。为了在屏幕上凸显出高低变化的连续性，我们可以用对数尺度来替换线性尺度:

转化为OpenCV代码:

magI // 转换到对数尺度
log(magI, magI);

剪切和重分布幅度图象限. 还记得我们在第一步时延扩了图像吗? 那现在是时候将新添加的像素剔除了。为了方便显示，我们也可以重新分布幅度图象限位置(注：将第五步得到的幅度图从中间划开得到四张1/4子图像，将每张子图像看成幅度图的一个象限，重新分布即将四个角点重叠到图片中心)。这样的话原点(0,0)就位移到图像中心。

2));
2;
2;

Mat q0(magI,144); font-style:italic">// Top-Left - 为每一个象限创建ROI
Mat q1(magI,144); font-style:italic">// Top-Right
Mat q2(magI,144); font-style:italic">// Bottom-Left
Mat q3(magI,144); font-style:italic">// Bottom-Right

Mat tmp;                           // 交换象限 (Top-Left with Bottom-Right)
q0.copyTo(tmp);
q3.copyTo(q0);
tmp.copyTo(q3);

q1.copyTo(tmp);                    // 交换象限 (Top-Right with Bottom-Left)
q2.copyTo(q1);
tmp.copyTo(q2);
 
     

归一化. 这一步的目的仍然是为了显示。现在我们有了重分布后的幅度图，但是幅度值仍然超过可显示范围[0,1] 。我们使用normalize()函数将幅度归一化到可显示范围。

normalize(magI,144); font-style:italic">// 将float类型的矩阵转换到可显示图像范围 // (float [0， 1]).

结果

离散傅立叶变换的一个应用是决定图片中物体的几何方向.比如，在文字识别中首先要搞清楚文字是不是水平排列的? 看一些文字，你就会注意到文本行一般是水平的而字母则有些垂直分布。文本段的这两个主要方向也是可以从傅立叶变换之后的图像看出来。我们使用这个水平文本图像以及旋转文本图像来展示离散傅立叶变换的结果。

水平文本图像:

旋转文本图像:

观察这两张幅度图你会发现频域的主要内容(幅度图中的亮点)是和空间图像中物体的几何方向相关的。通过这点我们可以计算旋转角度并修正偏差。

OpenCV之core 模块. 核心功能（2）基本绘图随机数发生器&绘制文字离散傅立叶变换输入输出XML和YAML文件与 OpenCV 1 同时使用

基本绘图

目的

OpenCV 原理

Point

Scalar

代码

代码分析

结果

随机数发生器&绘制文字

目的

代码

说明

结果

离散傅立叶变换目标

源码

原理

结果

输入输出XML和YAML文件

目的

代码

代码分析

结果

与 OpenCV 1 同时使用目的

概述

实例学习

猜你在找的XML相关文章

OpenCV之core 模块. 核心功能（2）基本绘图 随机数发生器&绘制文字 离散傅立叶变换 输入输出XML和YAML文件 与 OpenCV 1 同时使用

基本绘图

目的

OpenCV 原理

Point

Scalar

代码

代码分析

结果

随机数发生器&绘制文字

目的

代码

说明

结果

离散傅立叶变换 目标

源码

原理

结果

输入输出XML和YAML文件

目的

代码

代码分析

结果

与 OpenCV 1 同时使用 目的

概述

实例学习

猜你在找的XML相关文章

OpenCV之core 模块. 核心功能（2）基本绘图随机数发生器&绘制文字离散傅立叶变换输入输出XML和YAML文件与 OpenCV 1 同时使用

离散傅立叶变换目标

与 OpenCV 1 同时使用目的