:::: MENU ::::

TalkingData's Blog

现在开始,用数据说话。

锐眼洞察 | 如何让深度学习变得容易(翻译)

Enterprise

锐眼洞察 | 如何让深度学习变得容易(翻译)

作者:Alex Woodie

原文:How to Make Deep Learning Easy

译者:TalkingData研发副总裁 闫志涛

本译文禁止商用,转载请注明来源与译者!

 

译者注:如果大家关注行业资讯,深度学习和人工智能无疑是最常被提到的技术术语。这也反应了现在深度学习和人工智能的热度。深度学习在很多领域都取得了巨大的成功,可是如何能够简单的将深度学习应用到实际的业务中,去用深度学习解决业务问题,无疑是一个挑战。一个技术如果想要取得巨大的成功,绝对不应该是曲高和寡的技术,而是应该可以非常简单的被使用。在这篇文章中主要就是讲了深度学习如何可以更方便的被普通的公司和个人使用。答案实际上一点都不出人意料-云计算。这也契合了TalkingData在2018年的目标。我们应该将数据科学工作变得简单,提供交互式友好的DSS,同时我们需要通过SDMK提供高质量的数据集和模型,这样未来在中国,会有更多的开发者和企业可以真正的利用数据科学带来的价值。

 

深度学习已经成为训练计算机进行自动的识别停止标志、检测人的表情以及发现欺诈等活动的前沿工具。然而,深度学习内在的技术复杂度很容易让人望而却步。那么一个人应该如何开始使用深度学习呢? Forrester分析师Mike Gualtieri提供了一个令人惊讶的答案“做深度学习最简单的办法就是不用深度学习”,Gualtieri在Teradata最近召开的用户大会上说。

当然,Forrester的首席分析师并不是在用孔夫子老先生的谚语来忽悠大家。事实上,Gaultieri给出了一个非常重要的观点,那就是从深度学习的光鲜的外表下隐藏的令人生畏的技术细节中抽离出来。

这个抽离是可以通过云服务来实现的,Gualtieri说。每个一个公有云提供商,亚马逊AWS、微软Azure以及Google的计算引擎,都投入了大量的时间和金钱让他们的系统去支持不同的深度学习框架,包括MXNet、Keras以及TensorFlow。

更重要的是,他们已经在这些深度学习框架的基础上构建了有用的服务,比如图像识别、语音识别以及语言理解,并通过易于使用的API将这些服务暴露出去。

“很多云计算公司已经提供了预先训练好的模型,他们替你做了最难的那部分工作而你仅仅需要调用一个API,如果你想要使用深度学习,寻找并使用这些API,因为这是一个可以非常简单的让你开始做深度学习的方法”,Gualtieri说。

Forrester最近发布了一份报告,详细介绍了这些公有云提供商提供的具体能力,这份报告包括了三大云提供商以及通过Watson和HavenOnDemand提供深度学习能力的IBM和惠普等企业软件巨头在内。

这个分析团队还追踪Salesforce提供的深度学习产品,Salesforce通过其爱因斯坦产品提供计算机视觉功能。它还追踪两个深度学习创业公司,提供计算机视觉系统的Clarifai以及提供计算机视觉和语言理解的Indico。

Source: Forrester

虽然这些基于云计算的深度学习产品是有用的,但是它们可能并不能解决公司的某个特定的问题,也不能用于他们拥有的独特的数据。这就是为什么许多公司正在潜入深度学习之湖,并利用现有的库发展自己的专业能力。

根据Gualtieri的说法,深度学习框架的开源性使得它们非常容易获得,很多人都在使用它们。他们可以从GitHub下载TensorFlow,例如,在一个周末的时间里训练一些基于这些数据的模型。

虽然建造一个深度学习框架非常的困难,但是使用它并不是特别的难,尽管他们的复杂性非常的高。

他说:“我们说这些技能是罕见的。能够开发这些算法的人员的技能是非常罕见的。但是让我们需要弄清楚的是:当你建立一个模型时,你并没有开发算法,你正在使用已经开发好的算法。”

数据科学家不需要了解基于TensorFlow构建的图像识别系统具体是如何工作的,或者如何构建基于Theano的自然语言处理(NLP)系统。Gualtieri说:“他们只需要了解如何将它适当的拼装在一起。”

这并不是说通过深度学习的方式可以非常容易的获得好的结果。一些固有挑战仍在,包括获取高质量的数据去训练模型。

垃圾进垃圾出的现象仍旧是深度学习的一个巨大的阻碍。因为深度学习需要大量的数据,而提供给算法的人工标注数据代价高昂,获取足够的数据来训练有效的模型变得非常的困难。

“它不会像施了魔法一样去学习,而是通过标注来学习的”,Guartieri说。“没有固定的反馈,你不得不将它建立在模型中。对一个特别的需求选择正确的框架也是一个挑战。”当前市场的主要问题是这里有太多的框架以及太多的创新,这些框架正在进行一场战斗”, Gualtieri说。

Tensorflow_logo_black-300x225

TensorFlow似乎正在冉冉升起,但还不清楚它是否会成为未来的赢家。Gualtieri称赞Teradata明年将支持TensorFlow作为其新的Teradata分析平台计划的一部分,同时保持与其他框架(包括最近由微软和AWS推出的新的机器学习库Spark、Theano和Gluon)的开放连接的决定。

正如我们在其他大数据技术领域看到的那样,炒作倾向于引导决策者放弃他们可能不准备前往的方向。 我们已经看到Apache Hadoop可以为组织提供什么的不真实的假设,我们今天看到了深入的学习框架也在发生类似的事情。

Forrester已经向客户询问了深度学习的问题进行了调研,其中有些客户完全搞反了顺序。 “我们已经看到有公司购买NVidia DGX-1,这是一个129,000美元的盒子,然后问我们,现在我们该怎么办?

他继续说:“了解到企业能够用深度学习来做些什么是非常令人兴奋的”。 “我们认为这仅仅是开始,我们看到很多创新和技术团体正在进行深度学习相关的工作,我们认为2018年是深度学习的一年。”

Leave a comment

随时欢迎您 联系我们