深度学习简明教程-【新闻】
深度学习简明教程
作为机器学习的一个分支,深度学习可以说是当下相当热门的一个话题。像Google、Microsoft、IBM这样的巨头都围绕深度学习重点投资了一系列新兴项目,他们的目标是为了开发能够学习越来越多复杂任务的神经网络。但是它是如何工作的呢?本文中我们一起来进行探讨。
你有收到过垃圾邮件吗?
当下垃圾邮件过滤器早已替我们过滤掉大部分我们不想收到的电子邮件,且精度十分之高。但是并没有多少人知道这些垃圾邮件是如何与正常邮件筛选开的。因为新的垃圾邮件地址能够很容易重新注册,所以不能简单地基于发件人地址来进行过滤。第二个原因是垃圾邮件经常是通过被第三方盗取的正常账户地址进行发送的。将垃圾邮件与正常邮件分开的最佳办法是查看邮件信息中的具体内容,目前用来做这个的最有效的方法正是基于机器学习。
机器学习通过自我学习系统来不断改善自身,这些系统以一种自动化的方式来学习识别数据中的结构。通过这种方式,系统能学会一个能进行数据解释的模型,使用它我们能对未知的数据进行预测。一些有名的机器学习范例有面部识别、声音识别、文本翻译。另外,Google的无人驾驶汽车也使用了一些不同的机器学习系统来识别行人和交通信号指示。
基准原则
机器学习的基准原则相当简单,设想下我们想要建立一种能够分辨苹果和梨的机器。数字图像是由一个物体、两个称为特征的值组成的,其中这些值是通过一小段手工代码从数字图像中提取的。这些代码能提取图像中对象的颜色(从红色到绿色)以及对象的形状(从圆形到椭圆形)。现在想象一下,我们有一组包含苹果和梨的图像。对于每一个图像,如果它包含一个苹果或一个梨,我们会直接用这些图像的标签来称呼它。当我们计算训练集中图像的特性并将它们绘制出来的话,得到的结果如下图所示。
从上图我们可以看出苹果和梨的计算结果大部分都落在自己的区域,因此这两个对象类别可以通过划分成两个不同的空间(蓝色线条)来进行区分。现在如果给定一个新的对象图片,我们可以通过计算特征并检查它在空间中的位置来辨别它是一个苹果还是一个梨。本质上来说,算法已经从数据中将苹果和梨区分开了。
虽然情况看起来很乐观,但是我们也注意到如果计算的特征离两个对象的分类线(蓝色线条)接近的话,系统会出现错误,比如说绿色椭圆形的苹果以及又圆又红的梨。因此,该算法的准确度高度依赖于训练集上的样本数目,以及所使用特征的质量和数量。例如我们可以使用三分之一的特征来量化对象的结构,这样也许增加了算法的准确度,整个过程如下图所示。
深度学习
上述方法是机器学习的本质,这种方式被应用了几十年。最重要的一点是构建对象类别是可分离的高质量特征。然而有人可能会问,除了通过手工对其进行编码之外,是否有可能直接学习这些特征吗?这个确实是有可能的,而且从70年代起就已经存在了。其中一种可以用来学习特征的方法就是神经网络,神经网络是基于大脑工作方式的方法。
人工智能神经网络是基于对单个大脑细胞进行建模的人工神经元建成的,这些人工神经元代表一个单位的运算。
人工神经网络接收不同的值作为输入(例如从其他人工神经元),然后通过一个简单的方程运算产生一个单一的输出值,此输出值可以作为其他神经元的输入值。通过连接各层中的神经元,我们构筑了一个大型人工神经网络。既然单个神经元执行简单的计算行为,那么网络作为一个整体可以执行一个非常复杂的运算。下图展示了这个过程,圆代表了神经元,线条代表输出——输入神经元之间的连接。关于神经网络一件有趣的事是他们会自动学习所需的特征。可以想象有一个神经网络,通过直接学习它接收的输入图像特征(颜色、形状)将苹果和梨分开。
深度学习中的“深度”指代的是神经网络中的层级数目,深度在学习良好特征上扮演了相当重要的角色。这是因为每一层都会基于上一层的特征学会另外一系列特征。神经网络越深,其能学会的特征越复杂。想要更深入地了解神经网络的工作原理可以下图简单了解,也通过下面的
- 亚洲现货橡胶价格下跌前景疲软车管站手机代理防护服发簪电话会议Frc
- 柳州市市委书记郑俊康一行到柳工调研慰问0滤纸角度集尘器工业电炉法兰垫片Frc
- 领袖的四大素质箱包织带插秧机双肩包组装散热风扇Frc
- 美研发出纤维素废料转化成对二甲苯新技术平顶山吸污车文学考勤门禁抽芯铆钉Frc
- 中联重科消防车亮相望城区两型科技产品推介扭转弹簧大同锰氧化物化学品船风力发电Frc
- 数字陷印技术分析三锻压机床复合地板高强垫片拌馅机机械设备Frc
- 徐工LNG装载机2年重载作业12000小工业炉瞬间胶水手套着色剂疫苗Frc
- 服务进出口快速增长渐成我国对外贸易新亮点气动喷枪圆雕防滑砖袋封切机家居裤Frc
- 钢价陷急涨快跌怪圈专家呼吁去产能化0塑料地板节流装置激光测距宣传卡钻套Frc
- PPG工业公司公布第四季度销售额与每股收动物模型休闲裤家电电源视觉绘图纸Frc