分类
学界业界动态 评论型文章

深度学习如今还能走多远

(在苹果系统下,如果文章中的图片不能正常显示,请升级Safari浏览器到最新版本,或者使用Chrome、Firefox浏览器打开。)

2019年3月,计算机领域的最高奖——图灵奖,颁发给了深度学习的三位创造者Yoshua Bengio, Yann LeCun,和Geoffrey Hinton。这三位科学家对深度学习基本概念的发明,做出的令人们轰动的实验,对工程领域和深度神经网络实际应用的贡献,使得他们的得奖当之无愧。

如今,越来越多的人都知道深度学习,越来越多的人做研究和项目都要或多或少使用深度学习,越来越多的人学习深度学习并打算找一份机器学习算法工程师的岗位。与此同时,一些蛛丝马迹的逐渐出现,让我们对深度学习这一技术的发展需要报以谨慎态度。

机器学习,尤其是深度学习的含义,在这些年里,几乎等同于人工智能,2016年使用深度学习下围棋的AlphaGo的出现,将深度学习的热潮推向最高点。到了2019年,我们回望过去,发现深度学习的发展和应用,在这几年里,绝大部分都停留在了计算机视觉中,还有一少部分为语音识别和机器翻译等,以及会下围棋的AlphaGo。我们曾经对深度学习非常乐观,但借用中科院张钹院士的话说,“AI奇迹”也仅仅发生在计算机视觉、语音识别和围棋领域。在其他的领域中,深度学习的技术边界难以满足,其应用条件也不太符合。其应用必须具备充足的数据、确定性、完整的信息、静态规律和特定领域这几个条件。

其实从深度学习发展的根本原因来看,是大数据的出现、计算机的计算能力提升和算法的改进。这三项因素,使得微软提出的152层ResNet将图像识别错误率降至3.57%,使得微软5.9%词错率的语音识别技术达到专业速记员的水平,更使得谷歌的AlphaGo打败了围棋选手李世石。于是,很多人会觉得是否可以利用深度学习创造出更多的“奇迹”,甚至用来预测股票的涨跌,但直到今天都没有什么有用成果,因为股市是高度不确定和动态化规律的,甚至连信息也是不完整的。

深度学习目前主要是在计算机视觉和语音识别领域中“两开花”,但其应用“上限”也几乎止步于此,而且在产业落地方面还存在各种问题。在机器学习重要的应用领域——数据挖掘中,深度学习反而很少使用,哪怕仅仅一个普通的前馈神经网络也很少用,更多使用的仍旧是传统的朴素贝叶斯算法、决策树、K-Means和K近邻算法等。至于这里面的原因是什么,很多人的心里应该都有答案。

还有一个很重要的问题,深度学习是黑盒的技术,我们很难知晓其中到底发生了什么,为什么是这样,其决策的背后原因人们很难理解和发现。而且由于目前主要的机器学习技术是基于概率的,很多情况下,模型的决策仅仅是出于“少数服从多数”,当数据集有偏见和偏差的时候,或者技术自身的原因,其实际使用中的效果欠佳,有时甚至会带来争议和安全问题。比如AI机器人发布一些不当的言论,通过PS的图片或者对抗样本来对抗人脸识别系统,利用语音合成技术生成名人的假录音等。

人工智能的学派,主要有符号主义,连接主义和行为主义三种,从当今的情形来看,其各有长处,也各有局限性。使用哪种理论作为技术发展的基础不重要,重要的是我们要做什么样的事情,我们需要的是什么样的人工智能,我们想要一个什么样的未来。深度学习,并不能使我们做的看起来是阳春白雪一般,反而随着人们的涌入,有变成一种“下里巴人”的事物的趋势。我们应该时刻明白自己要做什么,自己需要什么,自己喜欢做什么,而不是随大流,蹭热点,为自己的工作披上一层本不需要的“高深”技术外衣。

参考资料

https://mp.weixin.qq.com/s/u5OAzlqKI3e_B9I_39qWJA

版权声明
本博客的文章除特别说明外均为原创,本人版权所有。欢迎转载,转载请注明作者及来源链接,谢谢。
本文地址: https://blog.ailemon.net/2019/05/27/how-far-can-deep-learning-go-now/
All articles are under Attribution-NonCommercial-ShareAlike 4.0

关注“AI柠檬博客”微信公众号,及时获取你最需要的干货。


“深度学习如今还能走多远”上的1条回复

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

19 − 14 =

如果您是第一次在本站发布评论,内容将在博主审核后显示,请耐心等待