您的位置：首页 > 其它

SIFT GPU 优化思路整理

2015-09-17 08:55 246 查看

1 高斯模糊采用分离滤波器，滤波器的长度容许截断误差2 X 4 + 1

2 Alloc blurBuf, diffBuf in global memory, diffBuf can be used as temp buffer for seperate filter

3 求局部极值点，可以先求邻域内的最值，然后中心点值与最值比较，以确认其是否为极值点

4 改变极值点过滤方案，先要求关键点满足边界响应要求，然后进行Hessian矩阵定位，可以减少计算量

5 极值点插值算法迭代一次即可满足要求？

6 关于Hessian矩阵求解是否有更好的优化方案？此处share memory提供快速IO, 内部计算时？

7 octave间计算的可并行性

8 多图像特征提取时时采用多线程实现多流异步机制，实现GPU卡的满负荷运作（此处要注意每个线程可用最大显存的合理分配）

9 特征点的第二个主方向确认可以在CPU端完成（是否有更好的GPU端解决方案）

10 描述子的生成需要验证GPU端与多线程模式的CPU端算法那个更有优势！

11 绝对值代替平方根？或者采用平方根近似求解方案？

12 图像上/下采样采用更优的GPU核优化

13 输入图像灰度图采用GPU优化方案，则CudaImage赋值时不再需要上传灰度图到GPU，速度肯定有提高

另：是否完整提交关于cudaSift的代码解析（晚些时候再启动，暂时时间紧张）

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航