人工智能与大数据的关系——详细梳解_科技前沿

人工智能与大数据的关系——详细梳解

来源：名曼机器人时间：2018-10-15 阅读量：2026

与大数据联系紧密的人工智能

一、人工智能的定义

人工智能（ArtificialIntelligence），英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来，理论和技术日益成熟，应用领域也不断扩大，可以设想，未来人工智能带来的科技产品，将会是人类智慧的“容器”。人工智能可以对人的意识、思维的信息过程的模拟。人工智能不是人的智能，但能像人那样思考、也可能超过人的智能。

人工智能是包括十分广泛的科学，它由不同的领域组成，如机器学习，计算机视觉等等，总的说来，人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。但不同的时代、不同的人对这种“复杂工作”的理解是不同的。

二、深入理解人工智能
人工智能的定义可以分为两部分，即“人工”和“智能”。“人工”比较好理解，争议性也不大。有时我们会要考虑什么是人力所能及制造的，或者人自身的智能程度有没有高到可以创造人工智能的地步等等。但总的来说，“人工系统”就是通常意义下的人工系统。
关于什么是“智能”，就问题多多了。这涉及到其它诸如意识（CONSCIOUSNESS）、自我（SELF）、思维（MIND）（包括无意识的思维（UNCONSCIOUS_MIND））等等问题。人唯一了解的智能是人本身的智能，这是普遍认同的观点。但是我们对我们自身智能的理解都非常有限，对构成人的智能的必要元素也了解有限，所以就很难定义什么是“人工”制造的“智能”了。因此人工智能的研究往往涉及对人的智能本身的研究。其它关于动物或其它人造系统的智能也普遍被认为是人工智能相关的研究课题。

人工智能在计算机领域内，得到了愈加广泛的重视。并在机器人，经济政治决策，控制系统，仿真系统中得到应用。

尼尔逊教授对人工智能下了这样一个定义：“人工智能是关于知识的学科――怎样表示知识以及怎样获得知识并使用知识的科学。”而另一个美国麻省理工学院的温斯顿教授认为：“人工智能就是研究如何使计算机去做过去只有人才能做的智能工作。”这些说法反映了人工智能学科的基本思想和基本内容。即人工智能是研究人类智能活动的规律，构造具有一定智能的人工系统，研究如何让计算机去完成以往需要人的智力才能胜任的工作，也就是研究如何应用计算机的软硬件来模拟人类某些智能行为的基本理论、方法和技术。

人工智能是计算机学科的一个分支，二十世纪七十年代以来被称为世界三大尖端技术之一（空间技术、能源技术、人工智能）。也被认为是二十一世纪三大尖端技术（基因工程、纳米科学、人工智能）之一。这是因为近三十年来它获得了迅速的发展，在很多学科领域都获得了广泛应用，并取得了丰硕的成果，人工智能已逐步成为一个独立的分支，无论在理论和实践上都已自成一个系统。
人工智能是研究使计算机来模拟人的某些思维过程和智能行为（如学习、推理、思考、规划等）的学科，主要包括计算机实现智能的原理、制造类似于人脑智能的计算机，使计算机能实现更高层次的应用。人工智能将涉及到计算机科学、心理学、哲学和语言学等学科。可以说几乎是自然科学和社会科学的所有学科，其范围已远远超出了计算机科学的范畴，人工智能与思维科学的关系是实践和理论的关系，人工智能是处于思维科学的技术应用层次，是它的一个应用分支。从思维观点看，人工智能不仅限于逻辑思维，要考虑形象思维、灵感思维才能促进人工智能的突破性的发展，数学常被认为是多种学科的基础科学，数学也进入语言、思维领域，人工智能学科也必须借用数学工具，数学不仅在标准逻辑、模糊数学等范围发挥作用，数学进入人工智能学科，它们将互相促进而更快地发展。

三、人工智能领域的成果
1.人机对弈
1996年2月10～17日， GARRYKASPAROV以4：2战胜“深蓝”（DEEP BLUE）；
1997年5月3～11日， GARRYKASPAROV以2.5：3.5输于改进后的“深蓝”；
2003年2月GARRYKASPAROV 3:3战平“小深”（DEEP JUNIOR）；
2003年11月GARRYKASPAROV 2:2战平“X3D德国人” (X3D-FRITZ）；
2016年3月9日至15日在韩国首尔进行的五番棋比赛，阿尔法围棋以总比分4比1战胜李世石；
2017年5月23日至27日在中国嘉兴乌镇进行的三番棋比赛，阿尔法围棋以总比分3比0战胜世界排名第一的机器人柯洁。

2. 模式识别

采用 $模式识别引擎，分支有2D识别引擎，3D识别引擎，驻波识别引擎以及多维识别引擎；
2D识别引擎已推出指纹识别，人像识别，文字识别，图像识别，车牌识别；驻波识别引擎已推出语音识别；3D识别引擎已推出指纹识别玉带林中挂（玩游智能版1.25）。

3.自动工程

自动驾驶（OSO系统）。百度投入大量成本到无人驾驶汽车的研究领域，他的开源自动驾驶系统“Apollo”，也已经进行过几次上路实验。当时百度总裁李彦宏坐着这辆无人驾驶汽车，在北京环路上撒了花的跑，最后还因为没有提前报备而吃了罚单...
印钞工厂（￥流水线）；
猎鹰系统（YOD绘图）。

4. 知识工程

以知识本身为处理对象，研究如何运用人工智能和软件技术，设计、构造和维护知识系统。

5.专家系统
智能搜索引擎；
计算机视觉和图像处理；
机器翻译和自然语言理解；
数据挖掘和知识发现。

四、大数据与人工智能的比较
大数据vs人工智能是一种公平的比较吗?在某种程度上，它是，但首先让我们理清它们之间的区别。

人工智能和大数据是人们耳熟能详的流行术语，但也可能会有一些混淆。人工智能和大数据有什么相似之处和不同之处?它们有什么共同点吗?它们是否相似?能进行有效的比较吗?这两种技术所具有的一个共同点是兴趣。NewVantage Partners公司对企业管理人员进行的大数据和人工智能调查发现，97.2%的企业高管表示他们的公司正在投资、构建或启动大数据和人工智能计划。更重要的是，76.5%的企业高管认为人工智能和大数据密切相关，数据的更大可用性正在增强其组织内的人工智能和认知。有人认为将人工智能与大数据结合在一起是一个很自然的错误，其部分原因是两者实际上是一致的。但它们是完成相同任务的不同工具。但首先要做的事是先弄清二者的定义，很多人并不知道这些。咨询巨头PriceWaterhouse Coopers公司的高级研究员Alan Morrison说：“我发现很多人对真正的大数据或大数据分析并不太了解，或者只是以几个突出的例子来了解人工智能。”

1.人工智能与大数据的区别
人工智能与大数据一个主要的区别是大数据是需要在数据变得有用之前进行清理、结构化和集成的原始输入，而人工智能则是输出，即处理数据产生的智能。这使得两者有着本质上的不同。
　　 人工智能是一种计算形式，它允许机器执行认知功能，例如对输入起作用或作出反应，类似于人类的做法。传统的计算应用程序也会对数据做出反应，但反应和响应都必须采用人工编码。如果出现任何类型的差错，就像意外的结果一样，应用程序无法做出反应。而人工智能系统不断改变它们的行为，以适应调查结果的变化并修改它们的反应。
　　支持人工智能的机器旨在分析和解释数据，然后根据这些解释解决问题。通过机器学习，计算机会学习一次如何对某个结果采取行动或做出反应，并在未来知道采取相同的行动。
　　大数据是一种传统计算。它不会根据结果采取行动，而只是寻找结果。它定义了非常大的数据集，但也可以是极其多样的数据。在大数据集中，可以存在结构化数据，如关系数据库中的事务数据，以及结构化或非结构化数据，例如图像、电子邮件数据、传感器数据等。
　　它们在使用上也有差异。大数据主要是为了获得洞察力，例如Netflix网站可以根据人们观看的内容了解电影或电视节目，并向观众推荐哪些内容。因为它考虑了客户的习惯以及他们喜欢的内容，推断出客户可能会有同样的感觉。
　　人工智能是关于决策和学习做出更好的决定。无论是自我调整软件、自动驾驶汽车还是检查医学样本，人工智能都会在人类之前完成相同的任务，但速度更快，错误更少。

2.人工智能和大数据协同工作
　　虽然它们有很大的区别，但人工智能和大数据仍然能够很好地协同工作。这是因为人工智能需要数据来建立其智能，特别是机器学习。例如，机器学习图像识别应用程序可以查看数以万计的飞机图像，以了解飞机的构成，以便将来能够识别出它们。当然，这是数据准备的重要步骤，Morrison指出，“人们开始使用的数据是大数据，但是为了训练模型，数据需要结构化和集成到足够好的程度，以便机器能够可靠地识别数据中的有用模式。”大数据提供了大量的数据，而有用的数据必须首先从大量繁杂的数据中心分离出来，然后再做任何事情。人工智能和机器学习中使用的数据已经被“清理”了，无关的、重复的和不必要的数据已经被清除。所以这是第一步。
　　在此之后，人工智能可以蓬勃发展。大数据可以提供训练学习算法所需的数据。有两种类型的数据学习：初始培训可以定期收集数据。人工智能应用程序一旦完成最初的培训，并不会停止学习。随着数据的变化，它们将继续接收新数据，并调整它们的行动。因此，数据是最初的和持续的。
　　这两种计算方式都使用模式识别，但方式有所不同。大数据分析通过顺序分析来找到模式，有时候是冷数据，或者是没有收集到的数据。Hadoop是大数据分析的基本框架，它是最初设计用于在低服务器利用率的夜间运行的批处理过程。机器学习从收集的数据中学习并不断收集。例如，自动驾驶汽车从未停止收集数据，并且不断学习和磨练其流程。数据总是以新鲜的方式出现并始终采取行动进行处理。

五、大数据与人工智能协同工作

1. 大数据在人工智能中的作用

人工智能一直在被人们关注。很多人对1999年推出的一部电影“黑客帝国”的情节记忆犹新，人类与那些变得聪明的机器殊死搏斗。但在现实的实施过程中，人工智能直到最近一直是边缘技术。
人工智能实现最大的飞跃是大规模并行处理器的出现，特别是GPU，它是具有数千个内核的大规模并行处理单元，而不是CPU中的几十个并行处理单元。这大大加快了现有的人工智能算法的速度，现在已经使它们可行。
大数据可以采用这些处理器，机器学习算法可以学习如何重现某种行为，包括收集数据以加速机器。人工智能不会像人类那样推断出结论。它通过试验和错误学习，这需要大量的数据来教授和培训人工智能。
人工智能应用的数据越多，其获得的结果就越准确。在过去，人工智能由于处理器速度慢、数据量小而不能很好地工作。也没有像当今先进的传感器，并且当时互联网还没有广泛使用，所以很难提供实时数据。
如今，人们拥有所需要的一切：快速的处理器、输入设备、网络和大量的数据集。毫无疑问，没有大数据就没有人工智能。

2. 应用于大数据的人工智能技术

对于传统的数据处理系统，它们仅仅是算法，会束缚相同的逻辑。当寻找异常的时候，传统的方法并不擅长，它缺乏灵活性。而人工智能系统运行起来具有模糊性，这使得它能够预测，会考虑一条路径，但是如果新数据否定了一个推理思路，那么开始寻找一个新的方向。给人工智能系统提供更多数据时它会变得更聪明，这非常适合“识别”随时间变化的异常。让我们来看看大数据应用的一些人工智能技术。

贝叶斯原理
贝叶斯原理描述了一个事件的概率，它是基于与事件相关的条件前验知识。这是基于先前事件来预测未来的一种方式。贝叶斯定理用于投资决策分析是在已知相关项目B的资料，而缺乏论证项目A的直接资料时，通过对B项目的有关状态及发生概率分析推导A项目的状态及发生概率。研究人员还使用贝叶斯模型来判断症状和疾病之间的相互关系，创建个人机器人，开发能够根据数据和经验来决定行动的人工智能设备。这是一个非常适合应用大数据的例子，因为越多的数据被反馈到贝叶斯算法里，其预测结果会变得越准确。

模式识别

顾名思义，模式识别用于检测数据中的模式和规律，它是机器学习的一种形式。模式识别系统利用数据训练的过程被称为监督学习。它们还可以被用来发现以前未知的数据模式，这个过程称为无监督学习。与基于单个数据类型的潜在异常的异常检测方法不同，模式识别可以发现以前在多个数据片中未知的模式，并考虑数据之间的模式（或关系）。一个公司（包括任何行业）可能都有兴趣知道什么时候发生了不寻常的事情，比如如果消费者突然开始购买一种与另一种一起购买的商品。这种模式可能是一个企业所感兴趣的。

外推法
外推法（Extrapolation）是根据过去和现在的发展趋势推断未来的一类方法的总称，用于科技、经济和社会发展的预测，是情报研究法体系的重要部分。外推法(Extrapolate) 通俗地说，它是一种很好的近似计算方法．对于已求得的低精度近似值，只要作几次最简单的四则运算，便立刻得到高精度的近似值．更简单地说，它是一种把低精度近似值加工到高精度的近似值的一种方法，简称精加工。我们假设一些数据呈现出一种趋势，公司高管想知道：如果这种趋势持续下去，三个月后公司将会发展到什么情况？用外推法。并非所有的趋势都是线性的。非线性的趋势需要基于多项式、圆锥曲线或曲线方程的外推函数。

六、总结
人工智能虽然已经发展了几十年，但正是由于大数据技术的发展（大规模并行处理器的出现）大大加快人工智能算法的运行速度，所以说，人工智能离不开大数据。同样，应用了人工智能技术的大数据分析则会更加聪明，得到更准确的结果。

分享到：

上一篇：AI智能机器人正在改变中国父母的养娃方式
下一篇：智能机器人的发展趋势展望——名曼机器人

人工智能与大数据的关系——详细梳解

与大数据联系紧密的人工智能

5G时代承载AI人工智能强力问世，将会怎么改变我们的生活

名曼教育陪护机器人上市，将成为家庭教育的标配

教育机器人在家庭中扮演什么角色，重要吗？