高斯软件的显卡并行主要通过以下两种方法实现:
线程级并行化:
利用CUDA的内核函数(kernel),将原算法中的每一个像素的背景更新过程映射到GPU的一个流处理单元上进行处理。通过多线程的并行执行来加速计算速度。
异步流处理优化:
利用CUDA编程模型中的流概念,使每个流之间的数据传输和计算重叠进行,隐藏数据传输所带来的时延,从而加速计算过程。
这些方法可以大幅度地加速混合高斯背景建模算法的执行过程。
高斯软件的显卡并行主要通过以下两种方法实现:
利用CUDA的内核函数(kernel),将原算法中的每一个像素的背景更新过程映射到GPU的一个流处理单元上进行处理。通过多线程的并行执行来加速计算速度。
利用CUDA编程模型中的流概念,使每个流之间的数据传输和计算重叠进行,隐藏数据传输所带来的时延,从而加速计算过程。
这些方法可以大幅度地加速混合高斯背景建模算法的执行过程。