您的位置：首页 > 其它

PointNet：Deep Learning on Point Sets for 3D Classification and Segmentation翻译

2018-07-25 20:54 806 查看

摘要：

点云是一种重要的几何数据结构，因为它的无序性，大多数研究将这种数据转换成规则3D体素网格（regular 3D voxel grids）或者图片集合（collections of images）。然而，renders data unnecessarily voluminous and causes issues.本文中，我们设计了一个新的神经网络，该网络能够直接处理点云数据，且使得这些点云数据准确地表现出输入数据的排列不变性。我们的网络名叫PointNet，提供了一种可应用于目标分类，语义分割，场景分割等的整体框架。最然简单，但PointNet非常有效且效率很高。按经验来说，该网络在par上表现很好甚至超过人工层面。理论上来说，我们对网络学习了什么和为什么网络能够对与输入的无序数据保持健壮性进行了分析。

简介：

在本文中我们利用深度学习框架处理3D几何数据例如点云数据和网格（meshes）数据，传统卷积框架需要有序的输入数据格式，如图片网格和3D体素数据，这是为了实现权重共享和其他核函数优化。由于点云数据或者网格数据不是有序的，所以大多数研究者吧这种数据转换成规则3D体素数据或者图片集合然后再放入深度学习网络。。。。。。。。

因此我们研究了一种不同的3D空间数据输入，直接处理简单的点云数据，并命名为PointNets.点云数据是简单而统一的结构，可以避免组合不规则性和网格的复杂性，因此是更加容易学习的。然而PointNet仍然必须尊重这样的事实：点云数据只是无序点的集合，因此保证排列不变性需要再网络计算中有确定的对称性，更进一步，刚体运动的不变性也需要被考虑。

我们的网络输入为：点云数据，输出为：分类标签（class label），或者每个点的分割标签（segment/part labels）.我们网络的基础框架是非常简单的，在初始化阶段，每个点是平等且独立的。在基础设置中，每个点只由其三个维度的坐标构成（x,y,z）。其他的维度由正常的计算和其他局部或全局特征添加。

我们的方法的关键在于简单对称方程和最大池化层的应用。尤其是学习一个优化方程/准则来选择点云中感兴趣或包含信息的点，为他们的选择原因编码（encode the reason for their selection）。网络的最后一层全连接层聚集了这些学习到的最优值并放入

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航