当前位置 : 首页/人工智能/深度学习/深度学习于人工只能机器领域的影响与发展

深度学习于人工只能机器领域的影响与发展

发布时间:2021年8月30日 15:02 作者:誉新源

一、深度学习概述


深度学习是机器学习的一个分支:它是一种从数据中学习表示的新方法,它强调从连续的层(layer)中进行学习,其对应于越来越有意义的表示。在“深度学习”中,“深度”并不是指用这种方法所获得的更深刻的理解,而是指一系列连续表示层。有多少层被包含在数据模型中,这称为模型的深度(depth)。这个领域的其他名字还包括分层表示学习(layeredrepresentationslearning)和层次表征(hierarchicalrepresentationslearning)**。

现在的深度学习通常包含几十个甚至数百个连续的表示层,并且所有的表示层都可以从训练数据中学习。另一些机器学习方法则关注于只学习一到两个层次的数据表示,因此有时也称为浅度学习(shallowlearning)。

而在深度学习中,这类层次化表示几乎总是通过称为神经网络(neuralnetwork)的模型学习得到的。神经网络采用分层叠加结构。“神经网络”一词源于神经生物学,然而,尽管深度学习的一些核心概念来源于人们对大脑的理解,但深度学习模型并非大脑模型。目前尚无证据表明大脑的学习机制与现代深度学习模型一样。

也许你读到过一些流行的科学文章,声称深度学习的工作原理类似于大脑,或根据大脑工作原理建模,但事实并非如此。对这个领域的新手来说,如果深度学习和神经生物学有什么联系的话,那会让人感到迷惑,反而是反作用。你们不需要那种“和我们的思想一样”的神秘包装,也不需要把深度学习和生物学之间的假想联系起来。为了达到目的,深度学习是一种从数据中学习表达的数学框架。

深度学习算法学到了什么表达方式?让我们看一个多层网络(见图1-5)如何转换数字图像,以确定图像中包含的数字。

该网络将数字图像转化为与原始图像有更多差异的图像,如图1-6所示,其有关最终结果的信息也日益丰富。您可以把深度网络想像为一个多层信息蒸馏操作:信息通过一个连续的过滤器,其纯度越来越高(即对任务有帮助)。

技术上对深度学习的定义是:学习数据表示的多层方法。这一点很简单,但是,一个非常简单的机器如果尺寸够大,就能产生神奇的效果。


二、使用三个图表来理解深度学习的工作


既然大家都知道机器学习是将输入(如图像)映射到目标(如标签“猫”),这个过程是通过观察大量输入和目标的例子实现的。你们也知道,深度神经网络通过一系列简单的数据转换(层)来实现这种输入到目标的映射,而这些数据转换都是通过观察例子学会的。以下就具体看看这种学习过程是如何进行的。

神经网络的每一层对输入数据进行的具体操作都保留在这个层的权值(weight)中,本质上就是一串数字。在术语中,每层实现的转换是根据它的权重(parameterize,见图1-7)来参数化。权值有时也称为该层的参数(parameter)。

因此,学习就是指为神经网络的所有层找出一组权重值,从而使网络能正确地将每个样本输入与其目标一一对应。但是问题是:深度神经网络可以包含上千万个参数。找出所有参数的正确取值是一件非常困难的工作,尤其是考虑到修改某个参数值会影响所有其他参数的行为。

要控制一件事,首先要有观察的能力。要控制神经网络的输出,需要有能力测量输出和期望输出之间的距离。这个任务也被称为目标函数(objectivefunction),神经网络损失函数(lossfunction)。损耗函数的输入就是网络预测值和真实目标值(即你想要的网络输出的结果),然后通过这个例子,计算一个距离值来衡量网络对这个例子的影响(见图1-8)。

深度学习的基本技巧就是利用距离值作为反馈信号,对权重值进行微调,从而减少当前示例的相应损失值(见图1-9)。这一调控是由实现所谓“反向传播”(backpropagation)算法的优化器(optimizer)来完成的,它是深度学习的核心算法。在下一章,我们将详细介绍反向传播的工作原理。

神经网络的权值是随机分配的,所以网络只实现了一系列的随机变换。结果自然与理想值相差甚远,相应的损失值也较大。但是随着网络处理的例子越来越多,权重值逐渐向正确的方向微调,损失值逐渐减小。那是一个训练循环(trainingloop),它可以让这个循环重复足够多的次数(通常有几千个例子)。

一个例子做几十次迭代),得到的权值能使损失函数最小。网络损耗极小,其输出值与目标值尽可能接近,构成了训练网络。再强调一遍,这是一种简单的机制,一旦它足够大,就能产生神奇的效果。


三、深度学习已取得的进展


尽管深度学习是机器学习中很早就出现的一个分支,但是它在21世纪的前十年才兴起。接下来的几年里,它在实践中取得了革命性的进步,在视觉和听觉等感知问题上取得了显著的成果,涉及到的技术在人类看来十分自然、十分直观,但长期以来却一直是机器难以解决的问题。

尤其要强调的是,深度学习已经取得了下列突破,而且这两个领域都是机器学习的难点:

在接近人类水平的图像分类器中,‰接近人类水平的语音识别率,接近人类水平的手写文字转录技术,更好的文本到语音转换的数字助理,如谷歌即时(GoogleNow)和亚马逊Alexa等接近人类水平的自动驾驶技术更好的广告定向投放,Google、百度、必应等都在使用更好的网络搜索结果。

我们仍在探索深度学习能力的界限。现在,我们开始将它应用到各种各样的问题上,如机器感知和自然语言理解。假如它成功了,那么深度学习就能帮助人类从事诸如科学研究、软件开发这样的活动。


四、不要相信短期的炒作


尽管近几年深度学习取得了显著的成就,但似乎对该领域在未来十年中能够取得的成就期望过高。尽管某些改变世界的应用(如自动驾驶汽车)已近在咫尺,但在诸如可信的对话系统、跨任意语言的机器翻译、达到人类水平的自然语言理解等方面,仍有很长的路要走。

特别是,我们不应将人类水平的通用智能(human-levelgeneralintelligence)的讨论太过当了。长期来看,预期过高的风险在于,一旦技术上不能实现,研究投资就会停止,而这将导致长期进展缓慢。
这过去曾发生过。以前人们对人工智能非常乐观,之后就是失望和怀疑,进而导致资金短缺。这一循环已经发生了两次,最早始于20世纪60年代的人工智能符号。早些年,人们对人工智能的未来充满了兴奋。最著名的符号主义人工智能方法的先驱者和拥护者之一马文·闵斯基在1967年宣称:“要用一代人的时间……基本上就能解决创造‘人工智能’的问题。”三年后的1970年,他作出了更精确的定量预测:“在三至八年的时间里,我们将有一台具有人类一般智力的机器。”

到了2021年,这个目标仍然是那么的遥远,很远,以至于我们无法预测需要多久才能实现。但是到了1960年代和1970年代早期,一些专家认为这个目标已经近在眼前(很多人都认为是如此)。数年后,由于预期过高,研究人员和政府资金都转移到了其它领域,这标志着第一次人工智能寒冬(AIwinter)(一种说法在冷战高峰后不久即出现)。

那可不是人工智能的最后冬天。20世纪80年代,一种新的象征主义人工智能——专家系统(expertsystem)开始在大公司中受到追捧。一开始就成功的几个案例引发了一股投资热潮,然后全球的公司纷纷建立人工智能部门以开发专家系统。一九八五年左右,每个公司每年都要花10亿多美元用于这项技术。但是在20世纪90年代早期,这些系统的维护费用越来越高,难以扩展,而且应用范围受到限制,人们逐渐失去了兴趣。因此,第二个人工智能冬天开始了。

在人工智能炒作上,我们可能会看到令人失望的第三次周期,我们仍然处在非常乐观的状态。最好是降低我们的短期期望值,让那些对这个领域不太了解的人清楚地知道深度学习可以做什么和不能做什么。


五、未来人工智能


尽管我们对人工智能的短期预期可能不现实,但长期前景还是光明的。对于许多重大问题,从医疗诊断到数字助手,我们才刚刚开始将深度学习应用到这些问题上,深度学习都扮演着变革的角色。在过去的五年中,人工智能的研究正以惊人的速度发展,这主要是由于人工智能历史短暂,从未有过的投资,但是迄今为止,这些进展很少能转化为改变世界的产品和生产过程。

许多深度学习研究成果还没有得到应用,至少还没有应用到它所能解决的所有工业领域的问题上。医生和会计都还没有用到人工智能。而且,你很可能在日常生活中使用人工智能。自然,你可以向智能手机提出一些简单的问题并得到合理的答案,或者从亚马逊网站上获得非常有用的产品推荐,或者在谷歌相册(GooglePhotos)网站搜索“生日”,并立即找到你女儿上个月的生日派对照片。和过去相比,这些技术已经大不相同了,但是这些工具仍然是日常生活的陪衬。AI还需要进一步转变成我们工作、思考和生活的核心。

目前,我们似乎很难相信人工智能将对世界产生巨大的影响,因为它还没有广泛的应用,就像1995年一样,我们很难相信互联网将会有怎样的影响。那时,大多数人没有意识到互联网和他们的关系,以及它会怎样改变他们的生活。这同样适用于现代深度学习和人工智能。但是别怀疑:人工智能正在到来。不久的将来,人工智能将成为你的助手甚至是你的朋友。这将回答你的问题,帮助你教育孩子和关注你的健康。同时,它也能把生活用品送到你的门口,并把你从A地送到B地。这也将成为你和日益复杂、信息密集的世界之间的接口。更重要的是,人工智能将帮助科学家在各个科学领域取得突破性进展(从遗传学到数学),从而帮助人类全面向前迈进。

就像互联网产业一样,在1998~1999年间,我们可能经历过一些挫折,也可能遭遇新的人工智能寒冬,互联网行业在1998-1999受到过度炒作,然后在21世纪初遭遇破产,导致投资停滞。但是,我们最终将达到上述目标。就像今天的因特网一样,人工智能最终会被应用到我们社会和日常生活的方方面面。

别相信短期炒作,但要相信长远眼光。AI的全部潜能可能还需要一段时间。潜力之大令人难以想象,但是人工智能最终会到来,并且会以一种奇妙的方式改变我们的世界。