分类
机器学习及应用

机器学习目前的应用

(在苹果系统下,如果文章中的图片不能正常显示,请升级Safari浏览器到最新版本,或者使用Chrome、Firefox浏览器打开。)

我刚开始跟别人说我在学习机器学习的时候,很多人就问我是不是搞硬件的,这让我很无语,毕竟,他们之前没听说过这个词,一听到“机器”二字就认为是硬件方面的东西。而实际上,这个事情虽然的确要懂硬件,但是核心的功夫完全不在硬件上,而是软件方面。毕竟,这个是跟人工智能相联系的东西,重要的是“智能”的实现,至于硬件,那是训练模型的时候(比如GPU)和实际应用中的机器人制造和物联网(Internet of Things)、传感器之类的了。

机器学习大量的应用都与大数据高度耦合,几乎可以认为大数据是机器学习应用的最佳场景。2010年以来,“大数据(Big Data)”这个概念变得越来越火热,似乎什么事情都要拿大数据来说话。然而处理这么大的数据量,几乎不可能通过人来进行统计分析,除非你本身收集不到多少数据,或者数据的维度很单一,但是那往往就脱离了大数据的范围了。大数据不仅是数量大,而且包含的信息很多或者几乎全部的信息,但是信息的密度往往又很低,有用的信息淹没在大量的数据中。你需要做的就是利用机器学习,从中挖掘出有用的信息。因为是大数据,还有可能发现很多传统的统计学手段无法发现的信息,甚至有人因此担心大数据时代无隐私。数据挖掘(Data Mining)在大数据中有应用,而数据挖掘就是用机器学习的方法对大规模数据进行自动或半自动的分析,以提取过去未知的有价值的潜在信息。

Google利用大数据预测了H1N1在美国某小镇的爆发:

百度世界杯成功预测了2014年世界杯所有比赛结果:

人工智能中有一个领域是模式识别(Pattern Recognition),模式识别是神经网络和深度学习重要的应用领域之一。模式识别是什么呢?它主要包括图像识别和语音识别等。那什么是模式呢?模式就是你要识别的那个对象,你要识别什么,什么就是模式。模式识别通过计算机技术使用数学方法来研究模式的自动处理和判读,其中以图像识别为主的计算机视觉与图像处理的应用最为广泛。我们可以利用图像识别来实现文字识别,人脸识别、指纹识别、虹膜识别以及现在非常火热的医学视频分析诊断等。2015年,微软自拍APP引起了大家的关注和兴趣,其中,智能一键美化功能让这款APP成为了大家的焦点,自然美颜,智能降噪,曝光增强。

虽然,我们使用它的时候,我们只需要3步,打开APP,摆好姿势,拍照,但是,它背后的算法流程可就不是那么简单了。输入图片之后,通过多帧降噪后,进行人脸特征检测,通过识别年龄和性别,进行人脸美化,再进行曝光增强,最好才得到输出的图片。

试想一下,我们是不是可以做一款这样的APP,现在雾霾如此严重,如果我们可以智能地将相机拍照后图片中的雾霾去掉,还原给我们一个高清的世界,那么一定很棒!而这,无疑需要用到机器学习技术,现在已经有不少研究了,我期待着大家能够一起努力实现它。

至于语音识别,我们将语音内容识别为文本之后,我们可以制作一个人工智能助理,或者语音文本输入,将文字输入速度提高一个级别,尤其是当我们在纠结是使用拼音输入法还是五笔输入法的时候。Cortana是一个微软研发的典型的人工智能助理,伴随着Windows 10 操作系统的发布而推出,苹果设备上也有同类产品Siri。使用它们,可以极大地方便我们的生活,甚至改变我们的生活方式,我们的生活可以被它们安排的井井有条。

聊天机器人也是最近几年和热的话题,在那个什么都还依靠硬编程来实现人机交互的时代,聊天机器人这种人工智能只能被看作一个“人工智障”,因为它实在是太蠢了,我们一点都不会觉得舒服。而这几年来,尤其是微软的小娜和苹果的Siri,让我们重新认识了什么是人工智能助理,微软小冰更是将黑科技解锁到底。这时我们惊奇地发现,跟我们聊天的不再是一个冷冰冰的机器人,似乎就是个有血有肉的人。不过,当前聊天机器人仍然不能做到通用,但是在垂直领域,还是可以实现不错的效果的,比如淘宝支付宝的机器人客服等。

我们每天都可能会收到各种垃圾邮件,这让我们很是烦恼,如果有人能够帮我们分好类,专门把垃圾邮件归为一类,然后不打扰我们,该有多好。现在,我们已经可以通过人工智能实现了。我们建立一个邮件分类的模型,一般都是通过神经网络实现,将垃圾邮件和正常邮件做一个二分类,输入邮件文本,然后经过一系列的计算,然后产生一个输出值,告诉我们是不是垃圾邮件。

围棋是2500年前的中国人发明的一个非常复杂的游戏,其搜索空间广阔,是一个天文数字,因此人工智能并不能像当年“深蓝”下象棋那样穷举所有的可能性。AlphaGo通过使用深度学习技术来实现机器下围棋的能力,并且取得了非常好的成绩,着实让大家眼前一亮,媒体也随之开始大量报道。AlphaGo首先通过大量学习人类棋手的棋谱,获得下围棋的基本能力,由于人类棋谱的有限,之后,又让它自己跟自己对弈,产生大量的棋谱来学习。最终,在举世瞩目的与李世石的对弈中,AlphaGo取得4:1的成绩。这就是深度学习的力量,“深度学习是人工智能进步的阶梯”。目前有消息称柯洁2017年四月将战AlphaGo,人类或将组团挑战AI,到时候结果如何,我们拭目以待。

==========  分割线  2018年修改补充: ==========

AlphaGo完胜!

==========  分割线结束  ==========

谷歌已经开源了用于AlphaGo的深度学习框架TensorFlow,现在已经支持Windows和Linux两大平台,并且使Python语言变得更火了。你可以在GitHub上搜到TensorFlow的开源代码以及文档,包括中文文档,然后使用TF来搭建自己的深度学习模型。

如今,我们的生活中处处离不开汽车,作为一名司机,开车时间长了会疲劳,而且不能喝酒,随时要注意路况、交通灯和标志牌,遵守交通规则,眼睛不能离开车的前方。一旦车启动,我们的命运全部掌握在司机的手里。有没有什么办法能让司机解放出来或者不用那么累呢?那就是自动驾驶汽车。有了自动驾驶,我们就可以解放我们的大脑和双手,我们也不必时刻盯着路况,而且可以比我们更少产生事故。我们开着车,抽出空来,可以喝一杯咖啡,再吃一块面包,或者发一封邮件,再做一些以前不敢这样做的事情。而自动驾驶背后的原理包括图像识别和计算机视觉,物联网和传感器,通信与网络等,当然,机器学习还是其核心,少不了人工智能技术的。

自动驾驶要实际投入应用的话,当前的基础设施还需要大量的改善,首先是5G和物联网技术的应用,当然还有人工智能。很多的科技公司都在做关于无人驾驶的研究,不过,目前的技术并不成熟,希望我们可以共同实现它。

推荐系统也是机器学习的重要应用之一,鉴于我上一篇文章简单介绍过原理和应用,这里限于篇幅,其他方面的应用不再详细说明。

2017年火起来了一个叫做“图像风格转换”的技术,就是利用两张图片,将其中一张图片上的画风应用到另一张图片上,使得另一张图片的风格也转化为那张图片上的画风。这种令人惊讶的操作实际上是应用了具有多个卷积层的神经网络来实现,随着深度学习卷积神经网络的崛起,使得将图片的风格和内容分离开并重新组合,变得可能起来。而最终的效果倒是挺有意思的,放上来源于网络上的几张比较有意思的图片。

如果你对这个非常感兴趣,可以查看一下原博主的这篇文章:
https://blog.csdn.net/stdcoutzyx/article/details/53771471

以机器学习为主的人工智能技术正在逐步的火起来,这些技术听起来高大上,好似“阳春白雪”,但是技术就是为了应用,不然就失去了意义。也许有那么一天,人工智能变成新常态,变得“下里巴人”起来,那时候,生活将会更美好。正如前三次工业革命一样,第四次工业革命即将到来。

机器学习是以数据为主的,需要大量的数据,而这也是很多人的瓶颈(包括我),这使得我们对数据产生了新的认识,冲击了我们传统对数据轻视的现象,有数据即为王,而得到数据的代价,很多时候都是很大的。

推荐课程:

Coursera: Machine Learning by Andrew Ng, Standford

非常基础的在线课程,是机器学习入门最好的网课。

参考资料:

1.【数据挖掘 – 维基百科】

2.【大数据 – 维基百科】

3.【模式识别 – 维基百科】

4.【微软自拍:让黑科技拯救不会拍照的你 – 微软亚洲研究院】

5.【Research Blog: AlphaGo: Mastering the ancient game of Go with Machine Learning】

由于本人水平有限,如果文章中有什么错误之处,欢迎大家指正,谢谢。

版权声明
本博客的文章除特别说明外均为原创,本人版权所有。欢迎转载,转载请注明作者及来源链接,谢谢。
本文地址: https://blog.ailemon.net/2017/02/05/current-applications-of-machine-learning/
All articles are under Attribution-NonCommercial-ShareAlike 4.0

关注“AI柠檬博客”微信公众号,及时获取你最需要的干货。


“机器学习目前的应用”上的2条回复

说到机器学习的应用在我国应该还有一个潜在的发展方向——G.F.W,作为一个几乎所有985高校都有参加的一个项目来讲,使用大量的数据和机器学习配合现有的深度包探测技术(DPI)可以更好地对境外所谓不法IP进行封锁。
等到我国互联网国际出口变成白名单制之后,真的就离《1984》的年代不远了…

你们作为新一代技术的研究者,任重而道远

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

19 + 20 =

如果您是第一次在本站发布评论,内容将在博主审核后显示,请耐心等待