深度学习瓶颈期,AI巨轮驶向深海

作者:珠海大横琴科技发展有限公司 浏览: 发表时间:2021-03-17 13:58:44

AI行业崇尚深度学习,但它本身的缺陷决定了其应用的空间被局限在特定的领域——大部分都集中在图像识别、语音识别。而目前深度学习似乎已经到了瓶颈期,就算财力和算力仍在不断投入,但深度学习的回报率却没有相应的增长。

清华大学人工智能研究院院长张钹曾认为:目前基于深度学习的人工智能在技术上已经触及天花板,此前由这一技术路线带来的奇迹在 AlphaGo 获胜后未再出现,而且估计未来也很难继续大量出现。

被寄予厚望的深度学习,是否会让人工智能陷入又一轮寒冬?在每一次人工智能“寒冬”到来之前,科学家都会夸大他们的研究的潜力。仅仅说他们的算法擅长某一项任务还不够,他们恨不得说 AI 能解决所有事。但真正的通用人工智能,离我们似乎还很遥远。

1

深度学习,得框架者得天下

深度学习的概念源于神经网络的研究,是研究神经网络的学问。这里的“深度”,指的就是神经网络含有无数隐层,深不可测。

在AI深度学习中,“得框架者得天下”

可以说,深度学习框架代表的是AI底层基础,是infrastructure。一个深度学习框架是不是足够好,是不是有生命力,就要看基于这个深度学习框架发展起来的人工智能产业是不是拥有足够的规模、有丰富的生态。

2021年全国两会正在进行时,科技自立自强的声音引人关注。其中,百度董事长兼首席执行官李彦宏也强调了深度学习框架这一 “智能时代操作系统”的重要性。

不久前,ARK 2021年度投资报告发布了2021年15大趋势预测,将深度学习排在第一位,称深度学习将在未来 15-20 年内,为全球股票的市值增加 30 万亿美元,可能是我们这个时代最重要的软件突破。

深度学习技术的广泛应用,正是得益于深度学习框架。百度CTO王海峰曾指出,在智能时代,深度学习框架起到承上启下的作用,下接芯片,上承各种应用,具有重要价值,是“智能时代的操作系统”。然而框架研发门槛高不可攀,对企业而言,开源开放的深度学习框架可以降低AI开发门槛,避免了在部分AI技术上重复造轮子,极大节省成本与时间。

也正因为如此,深度学习框架成为了全球科技巨头兵家必争之地。在这一领域,有谷歌的TensorFlow,百度的PaddelPaddel等等。Facebook、微软以及国内的腾讯、阿里等也都在陆续推出自己的深度学习框架。

以百度的PaddlePaddle为例,其项目负责人徐伟介绍:“在PaddelPaddel的帮助下,深度学习模型的设计如同编写伪代码一样容易,设计师只需关注模型的高层结构,而无需担心任何琐碎的底层问题。未来,程序员可以快速应用深度学习模型来解决医疗、金融等实际问题,让人工智能发挥出最大作用。”

也就是说,PaddelPaddel给人工智能产业的发展提供了一个类似IP授权或者底层操作系统的功效,相当于芯片领域的ARM IP Core或者智能设备的Android操作系统。

在深度学习发展初始,相关代码就被开源,有效框架使得深度学习“飞入寻常百姓家”,大大降低了学术界研究及工业界使用的门槛。

2

数据越多,越智能?

OpenAI 的 GPT-3 从自然语言处理衍生出了画画、敲代码等能力早前我们大科发的文章还科普过DeepMind 推出进阶版 AlphaGo——MuZero,它在下棋和游戏前完全不知道游戏规则,完全通过自己摸索赢得棋局。一时间,“AI 将替代人类”的声音不绝于耳。

上述谈到的OpenAI 最新的自然语言处理模型 GPT-3,几乎是把整个互联网的浩瀚内容全部读完了。它总共阅读了大约 5000 亿词,模型大概有 1750 亿参数。系统有上万个 CPU/GPU,它们 24 小时不间断地阅读任何领域的信息,半个月读完了整个互联网的内容。猛灌数据量,是这个 AI 模型的暴力所在。

但 GPT-3 也并不能因此变得完全像人,比如,它对不符合人类常理的伪问题也会应答,这恰恰证明它并不理解问题本身。前 Uber 人工智能实验室的负责人 Gary Marcus 就曾对深度学习多次泼冷水:

“人类可以根据明确的规律学习,比如学会一元二次方程的三种形式以后就可以用来解各种题目;见过了京巴、柴犬之后,再见到德牧就知道它也是一种狗。然而深度学习不是这样的,越多的数据 = 越好的模型表现,就是深度学习的基本规律,它没有能力从字面上给出的规律学习。”

深度学习是寻找那些重复出现的模式,因此谎言重复一千遍就被认为真理,所以为什么大数据有时会做出非常荒唐的结果,因为不管对不对,只要重复多了它就会按照这个规律走,就是谁说多了就是谁。张钹院士也表示深度学习没有那么玄。

由于它不能真正理解知识,“深度学习学到的知识并不深入,而且很难迁移。”Marcus 说道。而 AI 系统动辄拥有千亿参数,俨然就是一个黑匣子一般的谜。深度学习的不透明性将引致 AI 偏见等系列问题。最主要的是,AI 还是要为人所用,你要它做决策,你不理解它,飞机就让它开,谁敢坐这架飞机?

最主要的是,给 AI 猛灌数据的做法极其考验算力。算力供不起是一回事,但业界甚至认为这种暴力模式方向错了。知识、经验、推理能力,这是人类理性的根本。现在形成的人工智能系统都非常脆弱容易受攻击或者欺骗,需要大量的数据,而且不可解释,存在非常严重的缺陷,这个缺陷是本质的,由其方法本身引起的。深度学习的本质就是利用没有加工处理过的数据用概率学习的黑箱处理方法来寻找它的规律,它只能找到重复出现的模式,也就是说,你光靠数据,是无法达到真正的智能。

3

深度学习红利将尽,但 AI 还在发展

凯文·凯利在《失控》一书中曾明确分析指出,人类进化了数万年的成熟大脑值得技术人员学习,“除了生物体的逻辑之外,没有任何一种逻辑能够让我们组装出一台能够思考的设备。”

不少专家认为深度学习出现了根本错误,技术改良也很难彻底解决 这些都是AI存在的根本性缺陷。正是这些缺陷决定了其应用的空间被局限在特定的领域——大部分都集中在图像识别、语音识别两方面。

事实上,通过深度学习领域最大的成功案例之一GPT-3可以看出,基于大量数据达到流畅并逼近人类的对答效果,它确有成功的一面,但是GPT-3目前的表现也仅仅停留在娱乐层面,后来在诊疗模拟中并未解决“核心的问题”。

可以设想一下,2008年全球金融危机之后,全球最顶级的金融人才聚集一起修订巴塞尔协议来规避全球性危机。如果将这件事交给GPT-3,那危机至少要发生一百次甚至一千次,GPT-3才能总结和修订正确的方向,这是不可行的。

人可以在复杂环境、小样本之上做创造性的决定,基于深度学习的机器则要有成千上万次的试错才能解决应急问题,这在成本和应用场景层面都是有缺陷的,深度学习的红利随时都可能消耗殆尽。

回归现实,市场中其实为AI“留存”了巨大的商业机会。如受限于人力、时间等资源的不足,服务不到位成为当下普遍存在的问题,服务业因此存有巨大的提升空间。张钹表示,中国人工智能领域 20 个独角兽 30 个准独角兽企业,近 80% 都跟图像识别或者语音识别有关系,场景出现了诸多不合适。他认为,只要选好合适的应用场景,利用成熟的人工智能技术去做应用,还有较大的空间。

AI的目的是用低成本释放人类有限的精力、体力和经验,但是目前的AI技术做不到,所以在遭遇瓶颈之时我们不得不另寻他法。

目前在学术界围绕克服深度学习存在的问题,正展开深入的研究工作,像谷歌、BAT 这样规模的企业,他们都会去从事相关的研究工作,他们会把研究、开发与应用结合起来。

如今的 AI 热潮其实主要依赖模式识别和深度学习的成功。深度学习的红利将逐渐用尽,但 AI 的很多方向(感知、认知、学习语言理解、机器人、混合智能、博弈等)还会继续发展,不会因此跌入低谷而这么悲观。


深度学习瓶颈期,AI巨轮驶向深海
被寄予厚望的深度学习,是否会让人工智能陷入又一轮寒冬?在每一次人工智能“寒冬”到来之前,科学家都会夸大他们的研究的潜力。仅仅说他们的算法擅长某一项任务还不够,他们恨不得说 AI 能解决所有事。但真正的通用人工智能,离我们似乎还很遥远。
长按图片保存/分享

相关资讯

版权所有©珠海大横琴科技发展有限公司   粤ICP备16050130号