PointNet:Deep Learning on Point Sets for 3D Classification and Segmentation翻译
摘要:
点云是一种重要的几何数据结构,因为它的无序性,大多数研究将这种数据转换成规则3D体素网格(regular 3D voxel grids)或者图片集合(collections of images)。然而,renders data unnecessarily voluminous and causes issues.本文中,我们设计了一个新的神经网络,该网络能够直接处理点云数据,且使得这些点云数据准确地表现出输入数据的排列不变性。我们的网络名叫PointNet,提供了一种可应用于目标分类,语义分割,场景分割等的整体框架。最然简单,但PointNet非常有效且效率很高。按经验来说,该网络在par上表现很好甚至超过人工层面。理论上来说,我们对网络学习了什么和为什么网络能够对与输入的无序数据保持健壮性进行了分析。
简介:
在本文中我们利用深度学习框架处理3D几何数据例如点云数据和网格(meshes)数据,传统卷积框架需要有序的输入数据格式,如图片网格和3D体素数据,这是为了实现权重共享和其他核函数优化。由于点云数据或者网格数据不是有序的,所以大多数研究者吧这种数据转换成规则3D体素数据或者图片集合然后再放入深度学习网络。。。。。。。。
因此我们研究了一种不同的3D空间数据输入,直接处理简单的点云数据,并命名为PointNets.点云数据是简单而统一的结构,可以避免组合不规则性和网格的复杂性,因此是更加容易学习的。然而PointNet仍然必须尊重这样的事实:点云数据只是无序点的集合,因此保证排列不变性需要再网络计算中有确定的对称性,更进一步,刚体运动的不变性也需要被考虑。
我们的网络输入为:点云数据,输出为:分类标签(class label),或者每个点的分割标签(segment/part labels).我们网络的基础框架是非常简单的,在初始化阶段,每个点是平等且独立的。在基础设置中,每个点只由其三个维度的坐标构成(x,y,z)。其他的维度由正常的计算和其他局部或全局特征添加。
我们的方法的关键在于简单对称方程和最大池化层的应用。尤其是学习一个优化方程/准则来选择点云中感兴趣或包含信息的点,为他们的选择原因编码(encode the reason for their selection)。网络的最后一层全连接层聚集了这些学习到的最优值并放入
阅读更多- PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation
- 翻译 | Keras : Deep Learning library for Tensorflow and Theano
- Deep Learning for Video Classification and Captioning
- [论文阅读] VoxelNet:End-to-End Learning for Point Cloud Based 3D Object Detection
- 论文笔记 A Large Contextual Dataset for Classification,Detection and Counting of Cars with Deep Learning
- Some 3D Graphics (rgl) for Classification with Splines and Logistic Regression (from The Elements of Statistical Learning)(转)
- 笔记 NEURAL NETS FOR VISION CVPR 2012 Tutorial on Deep Learning
- Sensor fusion and input representation for time series classification using deep nets
- More 3D Graphics (rgl) for Classification with Local Logistic Regression and Kernel Density Estimates (from The Elements of Statistical Learning)(转)
- 看An incremental network for on-line unsupervised classification and topology learning
- 【文献阅读/翻译...】bayesian compression for deep learning深度学习中的贝叶斯压缩
- TPAMI2017 SegNet:A Deep Convolutional Encoder-Decoder Architecture for Scene Segmentation
- googLeNet--Inception四部曲四Inception-ResNet and the Impact of Residual Connections on Learning
- Neural Networks and Deep Learning之中文版翻译-前言
- Deep learning for image segmentation slide by Matthew Opala
- DeepID-Net:multi-stage and deformable deep CNNs for object detection
- 论文复现报告:Deep Region and Multi-label Learning for Facial Action Unit Detection
- Deep learning tutorial on Caffe technology : basic commands, Python and C++ code.
- DeepID-Net:multi-stage and deformable deep convolutional neural network for object detection
- 深度学习,A fast learning algorithm for deep belief nets