机器学习的崛起

日期: 2016-05-11 翻译:朱文浩 来源:TechTarget中国

本文摘自5月电子杂志《IT新架构》:活在边缘 突然之间,所有人都在谈论机器学习(Machine Learning)。在那些与调用内部数据、基于云端的优化服务、甚至是新的存储阵列内置产品中都可以看到机器学习的身影。 所以,到底发生了什么?这是全新的技术还是已经成熟了几十年的人工智能研究?深度学习需要一种神秘的仪式才能理解?还是我们的计算机在一夜之间变得更聪明了?我们睡着的时候是不是应该把手指放到关机键上?然而,对于IT人最重要的是,机器学习的进化是否使得它有足够的能力解决实际的业务问题?或者又只是长时间的炒作而已? 机器学习比我们想象的更接近现实。近来,媒体报道了大量的高度可视化的机器学习的应用……

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

本文摘自5月电子杂志《IT新架构》:活在边缘

突然之间,所有人都在谈论机器学习(Machine Learning)。在那些与调用内部数据、基于云端的优化服务、甚至是新的存储阵列内置产品中都可以看到机器学习的身影。

所以,到底发生了什么?这是全新的技术还是已经成熟了几十年的人工智能研究?深度学习需要一种神秘的仪式才能理解?还是我们的计算机在一夜之间变得更聪明了?我们睡着的时候是不是应该把手指放到关机键上?然而,对于IT人最重要的是,机器学习的进化是否使得它有足够的能力解决实际的业务问题?或者又只是长时间的炒作而已?

机器学习比我们想象的更接近现实。近来,媒体报道了大量的高度可视化的机器学习的应用实例,正面和负面的案例都有。微软的AI Twitter bot‘Tay’也达到了自己的目的,其旨在积极学习Twitter上不良青少年行为。在被激活的几小时里,它化身推特上一位顽劣的推主,学习并重复着令人憎恶的、充满性别歧视和种族主义的言论。通过学习过去数以百万盘围棋棋谱的最佳实践,谷歌的AlphaGo刚刚击败了围棋界的世界冠军。与此同时,谷歌的自动驾驶汽车撞上了一辆公交车,尽管速度很慢。显然还需要更多地学习人类的驾驶方式。

在深入挖掘之前,必须明确一下,我对机器学习的最新进展只有敬畏和尊重。我职业生涯的大部分时间都在以不同的方式直接和间接地参与应用人工智能和预测模型。尽管我目前的IT分析工作还没有形成专业的计算理论,还是有很多人出于乐趣和利益因素努力工作,通过使用电脑判断和预测趋势。我认为机器学习确实代表了改善这个星球生活方式的最值得期待的机会——今天利用大数据,明天优化物联网(IoT)。

机器真的有学习能力吗?

首先,我想揭秘机器学习的冰山一角。概括地说,机器学习是在一个给定的历史数据集内发现有用的模式。通常你可以观察输入值和输出值之间的关系,并最终根据结果来预测。尽管精确的定义是在教科书上,模型可以是一个特定的算法和具体参数,或用于“学习”的有用模式。

机器学习有两种类型:监督学习和无监督学习。基本的差异在于,监督学习可以捕获所需的输出值作为训练数据,而无监督学习尝试提取出内在的信息,如自然集群、层次结构或关联规则。当一个训练模型显示新输入数据,然后预测出输出值的——数字或分类,有时也可以直接作为概率。

这一切看起来都很棒,但人工智能(AI)机器人还没有统治世界。为什么呢?你需要明白一个问题,如果你想在某个给定的数据集里寻找模式,那么你就可以找到它。发现模式的趋势可能是人工智能的基础,能够有效地从我们所观察到的内容以外生成有用的可预测模式。但是,也许这种模式-发现型的智能关键问题在于,真正的人类智慧和人工计算机智能,会判断我们最终发现的模式是否是有意义的、真实的以及有价值的。

人工智能的停滞不前

AI领域长久以来一直在努力创造与人类等价的效果,例如判断什么是有意义的和真实的。但这的确很难,如果不是不可能的话,这一问题也不会困扰相关的AI研究长达几十年。实践性更强的机器学习领域一般只专注于实用的部分,这实际上也很有用。但是你要知道,机器学习工具不一定要在你的数据中寻找意义或真理。相互关系并不是因果关系,找到绝对的科学真理并不如建立一个通用的模型那般重要。

现在,我的意思是建立一个模型能足够准确地预测未来未知的结果,给了我们观察输入数据的新视角。以前我已经描述了一些方法来评估一个给定的模型是如何解决一个特定的问题。在这里我要重申,你必须对你试图解决的问题有很深入地理解,并且可以很清楚地面对你真正需要的有效的预测。这些都很好地解释了为什么数据科学家总是有高需求。几乎任何人都可以使用自动化的云服务托管的机器学习(例如,在微软Azure、AWS、Google Cloud上)快速地从任何可用的数据集生成较为精确的模型,但还是需要具有丰富经验的数据科学家真正地创建、理解和验证那些能够最优解决实际问题的模型。

一些数据科学家建议我们应该停止对人工智能的研究。有了大数据和物联网,应用大数据的方法,我们可以捕捉到每一个数据点,根据完整的数据轨迹生成动态智能,借助它来准确地猜测已经发生了什么,以及未来会发生什么。但是我不确定我们是否已经能够做到这一步,我也是《黑天鹅》作者Nicholas Taleb的粉丝,它告诫读者,人不能依靠训练模型从过去的数据中预测那些从未见过的未来事件。

相关推荐