当前位置 : 首页/人工智能/人工智能/浅析从人工智能到深度学习的发展与变革

浅析从人工智能到深度学习的发展与变革

发布时间:2021年9月10日 17:29 作者:誉新源

这篇文章慢慢地给你梳理了计算机科学家是如何把人工智能从最初的微小变化中发展到能够支持每天被数亿用户使用的应用的。


最早出现的、也是最大、最外侧的同心圆;第二个是机器学习,现在是深度学习的核心驱动力,是今天人工智能大爆炸的核心驱动力。


五十年代,人工智能曾一度非常受欢迎。在那以后,一些较小的人工智能分支出现了。首先是机器学习,然后是深度学习。深度学习是机器学习的一个分支,它对深度学习产生了前所未有的巨大影响。


一、由概念的提出到走向繁荣


一九五六年,几位计算机科学家聚集在达特茅斯会(DartmouthConferences),提出了“人工智能”的概念。此后,人工智能就一直在人们的头脑中盘旋,慢慢地在科学研究实验室中孵化。数十年后,人工智能出现了极化现象,或被称为光彩夺目的未来人类文明的预言;或者被当作技术狂人的狂人扔进垃圾堆。老实说,这两种声音直到2012年以前都是同时存在的。


最近几年,特别是2015年以来,人工智能开始爆发。GPU的广泛应用使并行计算变得更快、更便宜、更高效,是其主要原因。毫无疑问,无限扩展的存储能力和突如其来的数据洪流(大数据)的组合拳,也使得图像数据、文本数据、交易数据、地图数据的全面爆发。


下面我们来慢慢梳理一下计算机科学家是如何使人工智能从最初的一小步发展到能够支持每天被数亿用户使用的应用程序的。


1.人工智能(ArtificialIntelligence)为人类提供了一种智能


成王(Kingme):能下国际跳棋的程序是早期人工智能的一个典型应用,曾在五十年代引起轰动。(翻译:国际跳棋棋子到达底线位置后,可成王,成王棋子可后退)。


追溯到1956年夏天的那次会议上,人工智能的先驱者们梦想着利用当时新兴的计算机构建复杂的、具有与人类智慧同等重要特征的机器。我们现在称之为“强大人工智能”(GeneralAI)。这台万能机器拥有我们所有的知觉(甚至超过人类),所有的理性都能像我们一样思考。


还经常可以在电影中看到这样的机器:友善,像星球大战的C-3PO;邪恶,比如终结者。强大的人工智能现在仍然存在于电影和科幻小说中,原因不难理解,我们还无法做到这些,至少现在还没有。
现在我们能够达到的,通常被称为“弱人工智能”(NarrowAI)。弱智智能是指能像人类一样甚至比人类更好地完成特定任务的技术。比如,Pinterest的图片分类;或者Facebook的人脸识别。


这就是弱人工智能的应用实例。这两项技术实现了人类智能的某些部分。但是他们是怎么做到的?这一智慧来自何方?下面是同心圆内部一层,即机器学习。


2.机器学习--一种应用人工智能的方法


Spamfreediet:机器学习可以帮助你过滤掉电子邮箱中大多数(大多数)垃圾邮件。(译者注:垃圾邮件的英文单词spam来自于二战期间,美国曾大力援助英国的午餐品牌SPAM。在60年代之前,英国的农业一直没有从二战的损失中恢复过来,因此,这些廉价的罐头肉产品从美国大量进口。据说味道不太好,而且到处都是。)


使用算法来解析数据,从中学习,然后根据实际情况作出决策和预测,这是机器学习的最基本实践。机器学习不同于传统的硬编码软件程序,它用大量的数据“训练”,通过各种算法从数据中学习如何完成任务。


机器学习直接来自早期人工智能领域,传统的算法有决策树学习、推导逻辑规划、聚类、强化学习和贝叶斯网络等。大家都知道,我们还没有实现强人工智能,早期的机器学习方法甚至不能实现弱人工智能。


在计算机视觉领域中,机器学习最成功的应用领域是计算机视觉,尽管仍然需要大量的手工编码。为了使程序能够识别物体从哪里开始,到什么地方结束,需要手工编写分类器、边缘检测滤波器;编写形状检测程序,以判断是否有八条边;写分类器以识别字母"ST-O-P"。利用上述的这些分类器,人们总能开发出感知图像的算法,判断图像是否为停止标志。


这样的成绩很好,但并不是那种能使人感到高兴的成功。尤其是遇到云雾天,路标变得不那么清晰,或者被树木遮住,算法很难成功。正因为如此,在过去,计算机视觉的表现一直接近于人类的能力。这种方法过于僵化,太容易受到环境条件的影响。


学习算法的发展随着时间的推移改变了一切。


3.深度学习——机器学习的一种技术


HerdingCats:从YouTube视频里寻找一只猫的图片是深度学习领域卓越表现的首次展示。(译者注:herdingcats是一种英语成语,专为一群喜欢自由,不喜欢驯服的猫,用来描述混乱的局面,难以完成任务)


ArtificialNeuralNetworks是机器学习的一种重要算法,它经历了几十年的风雨。神经网络的基本原理是受到我们大脑的生理结构的启发——相互联系。但是,不像大脑中的单个神经元能够连接一定距离内的任意神经元,人工神经网络具有离散的层次、联系和数据传播的方向。


如:我们可以将一幅图像切割成一幅图像,然后输入到神经网络的第一层。一层的每个神经元都将数据传送到第二层。类似的事情发生在第二层,将数据传送到第三层,如此类推,直到最后一层,然后产生结果。


每个神经元都对其输入分配权负责,这个权值的正确性与它执行的任务有直接关系。最后的输出是由这些加权加总来确定的。


例如,我们仍然使用停止(Stop)标志。把停止标记图像的所有元素都打碎,由神经元进行“检验”:八边形的外形、救火车状的红色、明显突出的字母、典型交通标志的尺寸和静止运动等。神经网络的任务是得出结论,它究竟是不是停止标志。神经网络将根据所有权值,给出一个经过深思熟虑的猜测——“概率向量”。


本例中,系统可能会给出以下结果:86%可能是停止标记;7%可能是速度限制标志;5%可能是挂在树上的风筝等。网络结构随后通知神经网络,其结论是否正确。


就连这个例子,也算比较超前。直至不久前,神经网络还是被人工智能圈淡忘。实际上,在人工智能出现的早期,神经网络就已经存在,而神经网络对“智能”的贡献是微不足道的。其主要问题是,即使是最基本的神经网络也需要大量的运算。神经网络算法难以满足运算要求。


尽管如此,仍有一些虔诚的研究团队,以多伦多大学的GeoffreyHinton为代表,坚持研究,实现了针对超算的并行算法的运行和概念验证。但是,在GPU被广泛应用之前,这些努力并没有取得成效。
回顾这个停止标志识别的示例,我们会看到它。神经网络经过调制、训练,仍然容易出错。这一切都需要训练。训练需要数百张甚至数百万张图像,直到输入神经元的正确性,无论雾、雨或晴,每一次都能得到正确的结果。


只有这一次,我们才能说神经网络自学习得很成功,达到了停止标记的效果;在Facebook的应用程序中,神经网络对你母亲的脸进行了学习;还可以说,2012年吴恩达教授实现了神经网络对猫的学习,等等。


他的一个重大突破就是基于这些神经网络的显著增强。层次很多,神经元也很多,然后向系统输入大量的数据,对网络进行训练。