您的位置:首页 > 其它

SIFT GPU 优化思路整理

2015-09-17 08:55 246 查看
1 高斯模糊采用分离滤波器,滤波器的长度容许截断误差2 X 4 + 1

2 Alloc blurBuf, diffBuf in global memory, diffBuf can be used as temp buffer for seperate filter

3 求局部极值点,可以先求邻域内的最值,然后中心点值与最值比较,以确认其是否为极值点

4 改变极值点过滤方案,先要求关键点满足边界响应要求,然后进行Hessian矩阵定位,可以减少计算量

5 极值点插值算法迭代一次即可满足要求?

6 关于Hessian矩阵求解是否有更好的优化方案?此处share memory提供快速IO, 内部计算时?

7 octave间计算的可并行性

8 多图像特征提取时时采用多线程实现多流异步机制,实现GPU卡的满负荷运作(此处要注意每个线程可用最大显存的合理分配)

9 特征点的第二个主方向确认可以在CPU端完成(是否有更好的GPU端解决方案)

10 描述子的生成需要验证GPU端与多线程模式的CPU端算法那个更有优势!

11 绝对值代替平方根?或者采用平方根近似求解方案?

12 图像上/下采样采用更优的GPU核优化

13 输入图像灰度图采用GPU优化方案,则CudaImage赋值时不再需要上传灰度图到GPU,速度肯定有提高

另:是否完整提交关于cudaSift的代码解析(晚些时候再启动,暂时时间紧张)
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: