当前位置 : 首页/人工智能/深度学习/深度学习的定义与为什么要深度学习

深度学习的定义与为什么要深度学习

发布时间:2021年8月30日 15:14 作者:誉新源

一、深度学习是什么?

深度学习有以下几个广为人知和广为接受的定义。

1)深度学习是机器学习的一个分支。

(2)深度学习采用层叠的多层(非线性)处理单元,即人工神经网络(ANN),以及受大脑结构和功能(神经元)启发的算法。每一个连续层使用前一层的输出作为输入。

(3)深度学习使用ANN进行特征提取和转换,处理数据,寻找模式和开发抽象。

(4)深度学习可以是监督的(例如分类)或无监督的(如模式分析)。

(5)深度学习利用梯度下降算法,对不同层次的抽象层次进行学习,从而形成概念的层次结构。

(6)深度学习通过学习把世界作为概念的嵌套层次来实现强大的功能和灵活性,每个概念都定义在一个更简单的概念基础上,而更为抽象的表示则在较不抽象的概念基础上计算。

比如,对于图像分类问题,深度学习模型使用了它的隐含层结构来增量地学习图像类。

第一,它自动提取低级特征(例如亮或暗);然后,提取高级特征(如边缘);第二,它提取最高级别的特征(如形状),以便对其进行分类。

每一个结点或神经元都代表着整个图像的一个微小部分。把它们组合起来,就可以描绘出整个画面。并且他们能够完整地呈现图像。在此基础上,对网络中每个节点和每个神经元进行权值。权值代表

了神经元的实际重量,并与输出的关联强度有关。在模型开发期间,可以调整这些权重。

深度学习和经典学习

(1)人工特征提取和自动特征提取。为解决传统ML技术中的图像处理问题,需要先提取人工特征(如HOG和SIFT),以减少图像的复杂度,使模式对学习算法更直观,从而更好地工作。深度学习算法的最大优势在于,他们试图用增量的方式来学习低层次和高级特征。这样就不需要手工提取或工程中的手工特性。

(2)结合端到端的解决办法。常规ML技术是通过分解问题,先解决不同部分,然后把结果聚集起来提供输出性的解决方案,而深度学习技术利用端到端的方法来解决问题。在目标检测问题中,例如SVM的经典ML算法需要一个边界框目标检测算法,该算法将识别所有可能的目标,用HOG作为ML算法的输入,以识别正确的目标。而深度学习(比如YOLO网络)则以图像为输入,并提供物体的位置和名称作为输出。

(3)培训时间和先进的硬件。深度学习算法与传统ML算法不同,由于深度学习算法具有较大的参数和较长的训练时间,需要在GPU等高端硬件上对深度学习模型进行训练,并记住合理的训练时间是有效训练模式的重要方面。

(4)适应性和可转让性。传统的ML技术有很大的局限性,而深度学习技术的应用范围非常广,并且适用于不同的领域。有一大部分是用于传输学习,这使得人们可以在同一领域中使用经过训练的深层网络来实现不同的应用。比如,在图像处理中,通常采用预训练的图像分类网络作为图像特征提取的前端,对目标进行分割。

目前,我们来看一下ML和深度学习模型在图像分类上的差异(比如猫和狗的图像)。在传统ML中,特征提取和分类器可以解决任何问题,如图10-1所示。

图10-1传统和经典ML。

如图10-2所示的是深度学习网络,通过深入学习,可以看到前面讨论的隐层和实际的决策过程。

图10-2深度学习网络。

二、为什么需要深度学习


正如前面提到的,如果有更多数据,最好的选择是使用性能更好的深度网络进行处理。通常,数据使用得越多,结果就越精确。传统的ML方法需要一个复杂的ML算法集,较多的数据量只会影响其精度,需要用复杂的方法来弥补其误差。另外,学习也会受到影响——当增加更多的训练数据来训练模型时,某个时候学习就会停止。如图10-3所示,描述了深度学习算法与传统机器学习算法在性能上的差异。

图10-3深度学习算法和经典机器学习算法的性能比较。

图象处理,人脸识别的计算机视觉图像修复。

程序设计入门教程零基础,深度学习爬虫。

利用Python的图像处理库、机器学习库和深度学习库来解决图像处理问题。