如何传递和访问C向量到OpenCL内核?

前端之家收集整理的这篇文章主要介绍了如何传递和访问C向量到OpenCL内核?前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
我是C,C和OpenCL的新手,并尽力在现在学习.这是一个预先存在的C函数,我试图找出如何使用C或C绑定到OpenCL.
#include <vector>

using namespace std;

class Test {

private:

    double a;
    vector<double> b;
    vector<long> c;
    vector<vector<double> > d;

public:

    double foo(long x,double y) {
        // mathematical operations
        // using x,y,a,b,c,d
        // and also b.size()
        // to calculate return value
        return 0.0;
    }

};

大体上我的问题是如何传递这个函数访问绑定和内核的所有类成员.我知道如何传递标量值,但我不知道的向量值.有可能有一种方式来传递给上述每个成员或内存的指针,以便OpenCL的视图与主机内存同步吗?打破我的问题如下.

>如果将成员b和c传递给可变大小的绑定和内核,我该如何传递?
>如果它是二维的,我如何通过会员d?
>如何从内核中访问这些成员以及在内核的参数中声明哪些类型?将简单地使用数组索引符号,即b [0]可以访问?
>如何在内核函数调用与b.size()相当的操作,否则我不会将其作为额外的参数传递到绑定到内核中的大小?如果改变会发生什么?

我非常感谢C或C绑定和内核代码示例源代码在答案.

非常感谢.

解决方法

>您必须分配一个OpenCL缓冲区并将您的cpu数据复制到其中. OpenCL缓冲区具有固定的大小,因此如果数据大小发生变化或者使其“足够大”,则必须重新创建它,如果需要更少的内存,则只能使用它的一部分.例如,为b创建缓冲区,同时将其所有数据复制到设备:
cl_mem buffer_b = clCreateBuffer(
    context,// OpenCL context
    CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR,// Only read access from kernel,// copy data from host
    sizeof(cl_double) * b.size(),// Buffer size in bytes
    &b[0],// Pointer to data to copy
    &errorcode); // Return code

也可以直接映射主机内存(CL_MEM_USE_HOST_PTR),但是在创建缓冲区之后,这对对齐方式和对主机内存的访问会产生一些限制.基本上,当您当前没有映射它时,主机内存可能包含垃圾.
>这取决于第二维中向量的大小是否相等?然后在将它们上传到OpenCL设备时将其平坦化.否则会变得更加复杂.
>在内核中声明缓冲区参数为__global指针.例如,__global double * b将适合于在1中创建的缓冲区.您可以使用内核中的数组符号来访问缓冲区中的各个元素.
>您不能从内核中查询缓冲区大小,因此必须手动传递.这也可以隐含地发生,例如.如果工作项数与b的大小相匹配.

可以访问计算所有数据的内核可能如下所示:

__kernel void foo(long x,double y,double a,__global double* b,int b_size,__global long* c,__global double* d,__global double* result) {
  // Here be dragons
  *result = 0.0;
}

请注意,您还必须为结果分配内存.如果需要,可能需要传递额外的大小参数.你会调用内核如下:

// Create/fill buffers
// ...

// Set arguments
clSetKernelArg(kernel,sizeof(cl_long),&x);
clSetKernelArg(kernel,1,sizeof(cl_double),&y);
clSetKernelArg(kernel,2,&a);
clSetKernelArg(kernel,3,sizeof(cl_mem),&b_buffer);
cl_int b_size = b.size();
clSetKernelArg(kernel,4,sizeof(cl_int),&b_size);
clSetKernelArg(kernel,5,&c_buffer);
clSetKernelArg(kernel,6,&d_buffer);
clSetKernelArg(kernel,7,&result_buffer);
// Enqueue kernel
clEnqueueNDRangeKernel(queue,kernel,/* ... depends on your domain */);

// Read back result
cl_double result;
clEnqueueReadBuffer(queue,result_buffer,CL_TRUE,&result,NULL,NULL);
原文链接:https://www.f2er.com/c/113221.html

猜你在找的C&C++相关文章