您的位置：首页 > 其它

论文笔记——Deep Model Compression Distilling Knowledge from Noisy Teachers

2017-10-12 00:22 1141 查看

论文地址：https://arxiv.org/abs/1610.09650

这篇文章就是用teacher-student模型，用一个teacher模型来训练一个student模型，同时对teacher模型的输出结果加以噪声，然后来模拟多个teacher，这也是一种正则化的方法。

注意：加噪声的时候对输入进行了采样，不然直接全加也太暴力了吧。

本文想法比较简单，就是给teacher输出结果加噪声，美曰其名，learn from multi teachers.

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航