人工智能、机器学习和深度学习的区别和联系

从2015下半年开始,“人工智能(AI)”这个词逐渐出现在大众的视野中。近两年来,无论是资本、政府还是公众,对人工智能的关注都在持续升温:各类人工智能相关的创业公司都获得了可观的融资,政府工作报告中多次提到“人工智能”,百度的搜索指数也反映了这一趋势。

然而,“人工智能”并不是自己火的。他还有两个形影不离的队友:“机器学习”和“深度学习”。这三个词,像天界组合,出现在各个地方,有时甚至互相化身。那么问题来了。人工智能、机器学习和深度学习是什么关系?它们之间有什么联系和区别?这里不拆分概念,先从人工智能的发展说起。

人工智能的过去和现在

1956年夏天,以约翰·麦卡锡、马文·明斯基、纳撒尼尔·罗彻斯特和克劳德·香农为首的一批年轻科学家聚集在达特茅斯,研究和讨论利用机器模拟智能的一系列相关问题(史称“达特茅斯会议”)。在那次会议上,“人工智能”一词被提出,这也标志着新兴学科“人工智能”的正式诞生。

当时人工智能的研究处于“推理时期”,人们认为只要能赋予机器逻辑推理的能力,机器就具有了智能。当时的研究确实取得了一些成果,比如证明了很多数学定理,有些定理甚至比数学家还要巧妙。

然而,人类的智能不仅来自逻辑推理能力,还来自大量的经验和知识。举个例子,如果我从来没有坐过飞机,也没有给别人买过机票,当你问我明天去北京的机票多少钱的时候,我估计会不知所措,而且我连携程都不知道,所以我没有那么“聪明”,但实际上我的推理能力并没有下降。从20世纪70年代开始,人工智能的研究进入了一个“知识时期”,人们希望在推理的基础上,把各个领域的知识总结出来,讲给机器听,让它获得智能。当时,大量的专家系统(具有大量专业知识和经验的程序系统,可用于推理和判断,模拟人类专家的决策过程)问世,并在许多应用领域取得了许多成就。

但是人们很快意识到,要把知识总结出来教给机器是非常困难的(被称为“知识工程的瓶颈”),因为人类的知识实在太多了,他们必须用机器能理解的形式来写。要是能给机器一些相对原始的数据,然后让机器自己学习就好了。所以从80年代开始,机器学习的技术路线逐渐主导了人工智能的研究,直到现在。

什么是机器学习?

机器学习可以理解为机器通过一定的方法(算法)从已知的经验数据(样本)中搜索并提炼(训练/学习)出一些规则(模型);提取的规则可以用来判断一些未知的事物(预测)。

比如我们接触1w单身王(已知样本),通过归纳、总结、对比(算法),找出TA们的一些* *性特征,然后把这些* *性特征作为判断单身王的依据(模型),这样下次遇到人(未知样本)就可以判断TA是否单身(预测)。

既然是从一堆已知样本中寻找规律,那么寻找规律的方式和规律的形式也会因人而异,也就是算法和模型可能不一样。所以机器学习本身就分了不同的流派,每个流派都有其代表性的模型和算法。机器学习主要分为符号学习(以决策树模型和相关算法为代表)、连接主义学习(以神经网络模型和相关算法为代表)和统计学习(以支持向量机和相关算法为代表)。符号主义学习和联结主义学习在20世纪80年代至90年代中期非常流行,而统计学习从90年代中期开始迅速占据舞台。值得一提的是,找出的判断一个人是否单身的一系列特征规律,其实就是一棵决策树。

深度学习的兴起

进入21世纪后,互联网和移动互联网的兴起引起了数据的爆炸式增长,云计算也大大增强了计算能力,同时神经网络的相关算法也逐渐成熟,这使得连接主义的代表——神经网络再度兴起。再回来的神经网络往往比以前有更大的网络层次,所以被称为“深度神经网络”。深度神经网络拥有足够的训练数据和计算能力,在许多复杂任务中取得了优异的性能,尤其是语音处理、自然语言处理和图像处理。性能的突破推动了人工智能在语音识别、文本翻译、人脸识别等一系列场景的应用,让大家看到了新技术落地带来的经济效益和想象空间,从而引起了人工智能的热潮。

摘要

说到这里,我们用一张图来说明人工智能的技术流派类别和演变。需要注意的是,虽然人工智能的流派在不断发展,但这并不意味着过去的技术路线已经被抛弃。这更像是一种面向实际应用的风格——在一个时代,某个技术流派正好可以解决这个时代需要解决的实际工业问题,所以自然会流行起来。目前,许多不同的机器学习技术正在被应用到各自适合的场景中,比如作为统计学习代表的支持向量机,仍然是文本分类任务的首选。

最后回答文章题目中的问题。人工智能是个大概念,是研究如何让机器获得智能的学科。机器学习是人工智能中的技术派,通过从已知样本中提取规则,获得判断未知样本的“智能”;深度学习是机器学习的一种,它学习的模型是深度神经网络。