您的位置:首页 > 理论基础 > 计算机网络

深度学习系列教程 - 1.2.1 如何将待预测数据输入到神经网络中

2017-08-30 17:31 771 查看
兄弟姐妹们,如需转载请标明出处:http://blog.csdn.net/jiangjunshow

总目录

通过对前面文章的学习,你已经知道神经网络可以对输入的数据进行预测然后给出结果。输入数据我们用x表示,结果我们用y表示。此时,有朋友会问,在语音识别、人脸识别这些应用中,是如何将语音和人脸数据输入到神经网络中的?

假设我们希望神经网络能分辨出图片中是否有猫,结果只有两个——有或者没有,这被称为二元分类问题。我将拿这个例子给大家介绍如何将待预测数据输入到神经网络中。



此例中,待预测的数据是一张图像。为了存储图像,计算机要存储三个独立的矩阵(矩阵可以理解成二维数组),分别与此图像的红色、绿色和蓝色相对应(世界上的所有颜色都可以通过红绿蓝三种颜色调配出来)。如果你的输入图像的大小是64x64个像素(一个像素就是一个颜色点,一个颜色点由红绿蓝三个值来表示,例如,红绿蓝为255,255,255,那么这个颜色点就是白色),所以3个64×64大小的矩阵在计算机中代表了一张图像,对应于图像的红绿蓝的强度值。上图中只画了个5×4的矩阵,而不是64×64,为什么呢?第一是因为我很懒,第二还是因为我很懒,第三是因为没有必要,意思意思你能明白就可以了!做人不能太认真了。

为了更加方便后面的处理,我们一般把上面那3个矩阵转化成1个向量(向量可以理解成1*n或n*1的数组,前者为行向量,后者为列向量)。那么这个向量x的总维数就是64x64x3,结果是12288。在人工智能中,每一个输入到神经网络的数据都被叫做一个特征,那么上面的一张图像中就有12288个特征。这个12288维的向量也被叫做特征向量。神经网络接收这个特征向量x作为输入,并进行预测,然后给出相应的标签y,y为1或0,即是有猫的图像还是无猫的图像。

待预测数据就是这样被输入到神经网络中的。虽然对于不同的应用,需要识别的对象不同,有些是语音有些是图像有些是传感器数据,但是它们在计算机中都有对应的数字表示形式,通常我们会把这些数字表现形式转化成一个特征向量,然后将其输入到神经网络中。

关注我的微信公众号,新文章写好后我会及时推送给大家!

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
相关文章推荐