您的位置：首页 > Web前端

机器学习基石-03-2-learning with different Data Labels

2017-10-22 10:32 351 查看

1.supervised learning监督学习：每一个xn都有对应的yn

2.unsupervised learning无监督学习，没有yn

3.Semi-supervised半监督学习: Coin Recognition with Someyn

4.Reinforcement Learning强化学习

当你很难定义yn="坐下"的时候，可以找另一个yn="撒尿是不对的行为”进行惩罚punish；

此时狗狗听指令坐下了，但是yn="坐下"还是很难定义，再找一个新的yn="坐下是好的行为"进行奖励reward。

reinforcement learning：

1.不是在原有的输出yn=“sit”做评价，而是在新的yn上面进行“punish惩罚”或者“reward奖励”；

2.不是大批量输入的而是sequentially一次一次地逐次输入的。

总结

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航