多任务学习“Multi-Task Learning Using Uncertainty to Weigh Losses for Scene Geometry and Semantics”
2017-12-08 14:34
911 查看
多任务学习系统的性能很大程度上依赖于任务间的损失权值。手动调节权值非常耗时耗力,论文提出使用任务间的同方差不确定性给每个损失函数赋权。模型由单一图像同时学习像素级深度回归、语义及实例分割。场景理解的多任务学习在机器人领域比较实用,多个任务组合到一个模型可以降低计算量。
多任务学习中每个任务的最优权值依赖于调节尺度、任务的噪声幅值。论文多任务学习的结构为:
相关工作
多任务学习可以认为是归纳知识迁移,通过共享互补任务的域信息提升泛化性能。
MultiNet
CrossStitch
PoseNet
UberNet
多任务学习-同方差不确定性
简单的多任务学习,每个任务的权值线性相加:
Ltotal=∑iwiLi
这是模型的性能受权值选择的影响,调节权值耗时,如下图语义分类及深度回归的损失权值:
在贝叶斯模型中,有两类可以建模的不确定性,即认知不确定性(缺少训练数据)、偶然不确定性(数据不能解释信息)。偶然不确定性又可以分为两个子类:数据依赖地或异方差不确定性、任务以来地或异方差不确定性。多任务中,任务不确定性捕获任务间相关置信度,反应回归或分类任务的内在不确定性。
多任务似然估计
基于最大化同方差不确定性的高斯似然估计,生产多任务损失函数。fW(x)表示网络输出,对于回归任务,高斯似然估计为:
p(y|fW(x))=N(fW(x),σ2)
对于分类任务,使用softmax函数估计:
p(y|fW(x))=Softmax(fW(x))
多任务估计:
最大似然估计为log似然估计,两个任务的最小化目标为:
变量y1的噪声σ1增大,L1(W)的权值降低。反之亦然。
具有同方差任务不确定性的多任务目标函数最终为:
多任务学习中每个任务的最优权值依赖于调节尺度、任务的噪声幅值。论文多任务学习的结构为:
相关工作
多任务学习可以认为是归纳知识迁移,通过共享互补任务的域信息提升泛化性能。
MultiNet
CrossStitch
PoseNet
UberNet
多任务学习-同方差不确定性
简单的多任务学习,每个任务的权值线性相加:
Ltotal=∑iwiLi
这是模型的性能受权值选择的影响,调节权值耗时,如下图语义分类及深度回归的损失权值:
在贝叶斯模型中,有两类可以建模的不确定性,即认知不确定性(缺少训练数据)、偶然不确定性(数据不能解释信息)。偶然不确定性又可以分为两个子类:数据依赖地或异方差不确定性、任务以来地或异方差不确定性。多任务中,任务不确定性捕获任务间相关置信度,反应回归或分类任务的内在不确定性。
多任务似然估计
基于最大化同方差不确定性的高斯似然估计,生产多任务损失函数。fW(x)表示网络输出,对于回归任务,高斯似然估计为:
p(y|fW(x))=N(fW(x),σ2)
对于分类任务,使用softmax函数估计:
p(y|fW(x))=Softmax(fW(x))
多任务估计:
最大似然估计为log似然估计,两个任务的最小化目标为:
变量y1的噪声σ1增大,L1(W)的权值降低。反之亦然。
具有同方差任务不确定性的多任务目标函数最终为:
相关文章推荐
- [深度学习论文笔记][Scene Classification] Learning Deep Features for Scene Recognition using Places Database
- 立体匹配——End-to-End Learning of Geometry and Context for Deep Stereo Regression
- End-to-End Learning of Geometry and Context for Deep Stereo Regression
- 多任务学习“Rotating Your Face Using Multi-task Deep Neural Network”
- Learning to Divide and Conquer for Online Multi-Target Tracking
- 深度神经网络的多任务学习概览(An Overview of Multi-task Learning in Deep Neural Networks) --多任务学习-2
- Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks 论文学习
- Using labels to give semantics to tags学习笔记
- MTCNN解读:Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks
- 人群密度估计--CNN-based Cascaded Multi-task Learning of High-level Prior and Density Estimation for Crowd
- Using a Java class to control directory searches for people and groups
- 特征学习的matlab代码和数据集 Matlab Codes and Datasets for Feature Learning
- 论文阅读:Deep MANTA: A Coarse-to-fine Many-Task Network for joint 2D and 3D vehicle analysis
- MTCNN--《Joint Face Detection and Alignment using Multi-task Cascaded Convolutional Networks》疑问一大堆
- Using Qt to build an Omi App for iOS (and Android)
- 论文阅读:Deep Neural Networks with Multitask Learning(多任务模型应w用到自然语言处理)
- How to configure XDB for using ftp and http protocols with ASM [ID 357714.1]
- Scene is unreachable due to lack of entry points and does not have an identifier for runtime access via -instantiateViewControllerWithIdentifier解决办法
- how to config the tftpd-hpa server in the ubuntu using for remote tftp client '-p' and '-r' command
- 论文阅读:《Associative Embedding:End-to-End Learning for Joint Detection and Grouping》