本文为数据猿年关策划活动《大数据的2016,我的2016》系列稿件,感谢本文作者 天云大数据CEO 雷涛 先生的投稿(数据猿专访雷涛)。
敬请期待春节后的2月16日,由数据猿与中欧商学院、腾讯视频共同举办的高端领袖线下演讲栏目中欧微论坛之《超声波》。
2016年,Gartner发布的新兴技术成熟度曲线上,大数据赫然在曲线上消失,然而,就在三年前,大数据还处在成熟度曲线的顶峰,2014年开始走下坡路,2015年已经脱离曲线。
2016年,大数据已如空气般融入我们的生活,然而实际上,大数据的技术流行性高,而实际的价值还未真正体现,商业形态尚未成熟,当建设大数据的虚火热潮退却,需要通过真实的应用价值来回报。大数据寒冬正是市场机制自动产生优胜劣汰的过程,这是历史规律。
在人工智能领域,根据艾瑞数据预计,2020年全球AI市场规模将达1190亿元,年复合增速约19.7%;同期,中国AI市场规模将达91亿元,年复合增速超50%。AI产业的市场空间可谓是极为广阔。
举例来说,GOOGle公司正致力于无人车项目、IBM已携手Apple联合开发健康大数据人工智能平台、Facebook正测试名为“M ”的人工智能助手服务;而国内,百度已将人工智能当做自身发展的先锋力量,乐视推出了超级大脑,猎豹投入5000万美元研发机器人(20.24 +0.00%,买入)...众多互联网巨头都在扩张对AI产业的人才、资金投入,加速对AI领域的产业布局。
随着互联网和大数据技术的高速发展,面向特定领域的人工智能技术已经取得突破性进展,谷歌、微软、百度等巨头积极的在人工智能领域多点布局、抢占产业机遇,而其他以人工智能运算和应用为产品的初创公司也纷纷出现并发展。
这一切无疑都在预示着:AI行业已经成为新风口,产业化进程成为必然趋势。
行业被颠覆,大公司会垮掉。这并非耸人听闻,根据巴步森商学院的调查,今天在《财富》世界500强榜单上40%的公司都会在10年内销声匿迹。
10年之内,大数据与人工智能将会几乎改变每一个行业。
Welcome to MI Era——在这充斥着无数新锐的指数型组织与未来的百亿独角兽的摩登机器时代,人类该如何自处?又该如何与机器共生?
具体来说,AI的自学习能力,已经超过了人类对其程序化约束,如何与AI共生共演进,必须认知Machine IntelliGEnt,了解机器如何思考和行动。
一、从BI到AI,人类从数据操作工到设计师的晋升
首先从几个问题出发切入这个话题: 经典的大数据故事啤酒与尿布到底回答了我们什么?抽象的事实是否只“印证”了我们主观假设思维?数据面向人还是终将面向机器?人与数据之间的角色发生着什么样的变化。
当下,企业对于大数据技术的应用已经不再局限于BI,AI在商业实践中的价值日益凸显。而AI和BI的最大区别在于,是谁在做决策。经过BI分析,最后还是把数据交给人去做决策和判断,这个过程并没有形成闭环,同时周期和反馈延时也比较长。而AI的分析过程是层层嵌套的,每一个节点的数据都会作为下一个数据输入输出的依据,是一个闭环的过程。
BI就像是流水线的工人在一条生产线上重复拧螺丝的过程,其他环节是不理会的。而AI需要一个体系化的思路,需要人从生产线上退下来,设计整个流程模型并通过自动化的方式运行。在这个过程中,人是流水线的设计者,而AI的落地则是一个自动化、自我循环的供给过程。
其中,最难的环节在于如何定义问题,而不在解决问题。也就是说,这些大量的计算模型如何设计,是需要结合企业具体的业务经验才能有效落到实处的。
二、AI,还原世界的复杂性
人类习惯于抽象和简化思维,人工智能依靠质朴的数学和超强的计算能力,还原了世界的复杂性,AlphaGO帮我们定义了什么是大局观和棋风,深度学习的特征建立过程,就是协助我们对复杂问题描述的精确量化。笛卡尔为之后的牛顿准备了一个坐标系,使F=ma的推演成为经典。在步入MI机器智能时代的前夜,熟悉了解机器思考的方式,是人类能够生存并与之共同演进协同的基础。
三、AI的两面:人类保护自己的矛与盾
大数据时代,我们最担心和顾忌的就是自己的隐私。然而,人工智能不仅接触个体数据,也同样保护个体隐私。真正去使用大数据手段和技术的时候,是不会存在隐私问题的。
当我们只有一把钥匙对着一把锁的时候,当然会担心小偷把钥匙偷走。但是,如果我们门口放着一百万把钥匙呢?只有机器能对上!过载的信息会使得单独个体的信息被漠视,因为它的计算成本很高。
特别是在AI模式下,计算的过程已经通过AI模型设计好了,这是一个数学计算的过程,比如Apple公司使用差分隐私技术(Differential Privacy),能够把物理世界的你和虚拟世界的你隔离开来,开发者使用个体数据时,也不会有隐私泄露的问题了。
对抗生成网络(GAN),MI世界的罗马竞技场,人类如何操控两个AI怪兽互博,竞争中获得智力迭代。例:视觉计算的看图识字与预测
四、AI民主化(AI Democracy)
人类使用火拓展体能,使用指南 针拓展认知,AI的应用将是人类整体的智力提升。它必然是集体性的,而非少数利益集团所独占。但高深的数据科学,昂贵的计算资源和数据资源,三重障碍让AI依然是阳春白雪。如何让AlphaGO 的预测能力,像买书一样便捷便宜,推动了AI民主化。
得益于科技的变革,AI正式告别阳春白雪的年代,日益走向普及化、民主化,使得AI成为企业数字化转型的必备路径。在轻AI理念的普及之下,国内高科技企业正致力于对Alphago背后高深莫测的数据科学进行封装,增强其友好易用性,从而推动AI在企业的大规模应用。
Android/IOS平台化,屏蔽了技术复杂度,推动了移动互联网的繁荣。AI平台的兴起,将释放巨大AI潜能和催生更广阔人工智能市场。例:Google Tensorflow, Facebook FBLearner, MS CNTK,腾讯Angle, MaximAl.
Facebook、谷歌、亚马逊、微软和百度都在AI领域注入重资。机器学习迅速变成最火的人工智能形式,随着计算机系统越来越大、越来越复杂,很明显的是:它已不足以支撑计算机如何诠释数据的硬编规则(hard-code rules)。教计算机如何诠释自己的数据,要更加容易得多。
让人类失业、AI诠释自身,令人不免想起科幻电影“黑客帝国”的故事,关于机器与人类的最终命运的想象与讨论永远生生不息。
作者简介:
雷涛,现任天云大数据首席执行官,长江商学院特聘讲师,博士后工作站企业导师,拥有20余年北美信息科技公司从业经验。
2002年在Sun Microsystem晋级亚太区唯一的ES AmBAssador企业方案大使;
2005年入席SNIA存储工业协会中国区技术委员会联合主席;
2013年首批CCF中国计算机学会大数据专委会委员。