:::: MENU ::::

TalkingData's Blog

现在开始,用数据说话。

Posts Tagged / 人工智能

  • 一 19 / 2018
  • 0
Tech

锐眼洞察 | 使用卷积神经网络来检测卫星图像的特征(翻译)

作者:Ahmet Taspinar 

原文:Using Convolutional Neural Networks to detect features in satellite

译者:TalkingData数据科学家 李政昕

本译文禁止商用,转载请注明来源!

1.介绍

之前的博客文章中,我们已经看到了如何在TensorFlow中构建卷积神经网络(CNN),从零开始构建各种CNN架构(如LeNet5、AlexNet、VGGNet-16),并在MNIST、CIFAR-10、Oxflower17数据集上进行训练。

如果您一直关注最新的技术发展,您可能已经知道CNN能用于人脸识别、物体检测、医学图像分析、制造过程中的自动检测、自然语言处理任务以及其他许多应用。可以说,想找到CNN的实际应用,你仅仅受想象力和创造力(当然还有目的、精力和时间)的限制。

受到Kaggle的卫星图像特征检测挑战的启发,我想知道在卫星和航拍图像中检测特征是否容易。 如果这是可能的话,它的实际应用将是巨大的。在全球城市化进程中,城市正在不断扩大、发展和变化。这伴随着新的基础设施建设、新的建筑和社区诞生,以及景观的不断变化。监控和跟踪所有这些变化一直是一个劳动密集型工作。如果我们每天都可以得到全新的卫星图像,并使用深度学习来立即更新我们所有的地图,那么对于在这个领域工作的每个人来说都有非常大的帮助!

深度学习领域的发展如此之快,以至于几年前的热门——“简单”的图片分类已经显得过时了。目前,对象检测已经成为主流,在接下来的几年里我们可能会看到越来越多使用图像分割的应用(见图1)。

image

图1:计算机视觉中的任务可以分为图像分类、对象检测或分割任务

在这个博客中,我们将使用图像分类来检测航拍图像中的道路。 为此,我们首先需要获取这些航拍图像,并获取包含道路位置信息的数据(第2.1节)。 之后,我们需要将这两个图层放在一起(第3.1节)。 将准备好的数据集(第4.1节)以正确的格式保存后,我们可以将其送入建立卷积神经网络(4.3节)。 最后查看这个方法的准确性,并讨论可以使用哪些方法来改进它。

2.获取数据

任何数据科学项目中的第一个(也是最困难的)步骤总是获取数据。幸运的是,有许多包含各种形式卫星图像的开放数据集。有Landsat数据集、ESA的Sentinel数据集、MODIS数据集、NAIP数据集等。 每个数据集都有不同的优点和缺点。像NAIP数据集提供高分辨率(1米分辨率),但只覆盖美国。像Landsat覆盖整个地球,但分辨率较低(30米)。 还有其中一些数据集显示哪种类型的土地覆盖(森林、水、草地),其他数据集包含大气和气候数据。

由于我来自荷兰,所以我想使用覆盖荷兰的航空/卫星图像,因此我将使用PDOK提供的航拍图像。 这不仅是相当新的,并且他们也提供令人惊喜的25厘米的精度。

荷兰政府组织有很多可用的开放数据使用Pdokviewer,您可以在线查看大量这样开放的数据集:

  • 包含基础设施的层(荷兰的各种公路、铁路、水路(NWB wegenbestand)
  • 包含市与地区边界的层
  • 物理地理区域
  • 每个政府组织的位置
  • 农业区域
  • 每个街区的用电量
  • 土壤的类型与地形图
  • 每个街区的居民人数
  • 地表使用方式等等(甚至棕色长耳蝙蝠的生活栖息地)

image

图2:PDOK中可用的不同类型的图层

因此,有许多可用的数据集可以用作第二层(即作为包含道路位置信息的数据,之后需要与航拍图像数据进行合并),并使用它来自动检测卫星图像中的这些类型的特征。

PS:另一个包含很多地图的网站是Atlas Natuurlijk Kapitaal

2.1使用owslib下载图像

我感兴趣的图层是包含道路类型的图层。可以从荷兰政府的开放数据门户下载具有道路类型(NWB wegenbestand)的地图。航拍图像可以使用Web地图服务(WMS),可以通过Python包owslib下载。

WX20180122-103330

用“dx”和“dy”我们可以调整缩放级别。200的值大致对应于12的缩放级别,100的值大致对应于13的缩放级别。

此过程会在边界框((90000,427000),(110000,447000))内生成10.000个图块。这些坐标在rijksdriehoekscoordinate参考系统中给出,并且与WGS 84参考系统中的坐标((51.82781,4.44428),(52.00954,4.73177))相对应。 它覆盖了鹿特丹南部几平方公里(见图3),既包括城市也包括非城市地区,即我们的卷积神经网络有足够的道路进行训练。

image

图3:我们用来训练ConvNet的区域的边界框。

2.2查看包含荷兰道路的shapefile

接下来,我们将使用来自NWB Wegvakken(2017年9月版)的数据确定每个图像的内容。这是一个包含荷兰所有道路的文件,经常更新。可以从这个位置以shapefile的形式下载它。

Shapefile包含具有地理空间数据的形状,通常使用ArcGIS或QGIS等GIS软件打开。也可以使用pyshp库在Python中打开它。

WX20180122-103347

在这段代码中,列表’buffer’包含shapefile的内容。由于我们不想每次重复相同的shapefile读取过程,所以我们现在使用json.dumps()将其保存为json格式。

如果我们试图保存shapefile的内容,它会报错‘(…) is not JSON Serializable’。这是因为shapefile包含JSON本身不支持的数据类型(字节和日期时间对象)。 因此,我们需要为标准的JSON序列化器编写一个扩展,它可以获取JSON不支持的数据类型,并将它们转换为可序列化的数据类型。这是JSONencoder的方法。(关于这个方法的详情请看这里)。

WX20180122-103411

如果我们查看这个shapefile的内容,我们将会看到它包含以下类型的对象列表:

WX20180122-103437

它包含了大量的信息(手册中规定了每个信息的意义),但是对我们来说最重要的是

  • ‘WEGBEHSRT’ – >这表示道路类型
  • ‘coordinates’ – >这些是’rijkscoordinaten’系统中给出的这个特定对象的坐标。

在NWB Wegvakken中存在的不同的道路类型是:image

3.映射两层数据

现在应该确定哪些图像包含道路、哪些不包含道路。我们将NWB-Wegvakken的内容映射到下载的航拍照片的顶部来实现这一点。 我们可以使用Python字典来跟踪映射。我们还将使用字典来跟踪每个图像中存在的道路类型。

WX20180122-103452

在上面的代码中,前面从Shapefile转换为.JSON格式的NWB wegvakken的内容被加载到了dict_nwb_wegvakken中。

此外,我们初始化两个字典。第一个将填图像作为key,并将其内容列表作为值。第二个字典将填路类型作为key,将包含这些道路类型的所有图块作为值。如下所示:

WX20180122-103508

我们迭代dict_nwb_wegvakken的内容,对于每个元素,我们查找坐标和道路类型,并确认这些坐标是在我们的边界框内。通过以下方法来完成:

WX20180122-103522

add_to_dict方法首先通过确定每个tile命名的四个坐标(lowerleft x,y和upperright x,y)来确定一个坐标属于哪个tile。 我们还确定了每个坐标在tile中的相对位置。例如,“99800_445000_100000_445200.jpg”中的坐标(99880,445120)将具有相对坐标(0.4,0.6)。当你想绘制一个tile的内容时,这个方法很方便。

将道路类型与相对坐标一起添加到图像的内容列表。 同时,我们将tilename添加到第二个包含每个道路类型的tilename列表的字典中。

  • 如果只有一组坐标,并且这些坐标位于边界框内,我们立即将这些坐标添加到我们的字典中。
  • 如果元素中有多个坐标,我们不仅将所有的坐标添加到字典中,而且计算两个后续坐标之间的所有中间点,并将这些中间点添加到字典中。 这是必要的,因为两个坐标可以形成描述位于tile内部的道路的形状/线条,但是如果坐标恰好位于tile外部,我们将认为该tile不包含任何道路。 如图4所示。在左边我们可以看到描述一条道路的两点,但是它们碰巧位于tile外面,而在右边我们也计算两点之间的每一个中间点(每一个1 / POINTS_PER_METER米),并将中间点添加到字典中。

image

3.2可视化映射结果

利用可视化,查看映射是否正确、是否遗漏了道路,以及是否在两个坐标之间选择了足够的中间点以完全覆盖道路的所有部分。

WX20180122-103540

在图5中,我们可以看到两个数字,左边是(x0 = 94400,y0 = 432000),右边是(x0 = 93000,y0 = 430000)。 image

图5:体现NWB wegenbestand在tile上的映射结果的两张图

4.用卷积神经网络识别道路

4.1准备训练、测试和验证数据集

接下来,我们将把所有图像及其正确标签(道路是否存在以及道路类型)加载到数据集中。数据集是随机的,然后分成训练、测试和验证部分。

WX20180122-103602

我们可以使用以下函数对标签进行独热编码,并随机化数据集:

WX20180122-103613

4.2将数据集保存为一个pickle文件

将数据集加载到内存中的整个过程、尤其是随机化图像的顺序,通常需要很长时间。所以在完成一次之后,最好把结果保存为一个pickle文件。

WX20180122-103702

现在我们可以保存这次训练,在pickle中验证和测试这个数据集,准备部分的工作就完成了。

我们可以把这个pickle文件加载到卷积神经网络中并训练它来识别道路。

4.3训练卷积神经网络

正如你所看到的,在我们开始使用CNN之前,我们不得不做很多工作来准备数据集。这也反映了数据科学的现实:70%到80%的时间用于获取、理解和清理数据,数据的实际建模/训练只是工作的一小部分。

首先,我们从保存的pickle文件中加载数据集,从cnn_models模块中导入VGGNet并设置学习速率、批量大小等值。

WX20180122-103719

之后,可以构建包含卷积神经网络所有计算步骤的图并开始训练它。我们使用VGGNet-16卷积神经网络、l2正则化来最小化误差,学习率为0.0001。 在每一步中,训练准确率被附加到train_accuracies,并且在每10步,测试和验证准确率被附加到类似的列表。稍后我们将使用这些来形象化我们的准确率。

WX20180122-105502WX20180122-105536

4.5结果的准确率

下面是卷积神经网络的准确率结果。正如你所看到的,测试的准确率和验证集合在80%左右。

image

图6:训练、测试和验证集的准确率

从这些没有被准确分类的tile中可以看出,大部分被错误分类的tile是由于这些图片上的道路确实很难被检测到。 image

图7:被错误分类的一些tile

5.最后的话

我们已经看到了如何使用CNN在卫星或航空图像中检测道路。虽然我们通过卷积神经网络能够做的已经非常令人惊喜,但是AI和深度学习领域的技术发展是如此之快,“只是用CNN”已经过时了。

几年来,也有了被称为R-CNN、Fast R-CNN和R-CNN(如SSDYOLOYOLO9000)的神经网络。这些神经网络不仅可以检测图像中物体的存在,还可以返回物体的边界框。 现在还有可以执行分割任务的神经网络(如DeepMaskSharpMaskMultiPath),即它们可以确定图像中的每个像素属于哪个对象。 我认为这些可以执行图像分割的神经网络将是确定卫星图像内道路和其他物体位置的理想选择。在未来的博客中,我会初探如何使用这些类型的神经网络来检测卫星和航空图像中的道路(或其他特征)。

  • 一 02 / 2018
  • 0
Ideas

锐眼洞察 | 驱动业务AI数字化转型的4大因素(翻译)

作者:Felipe Sanchez

原文:The drivers of AI Business Transformation

译者:TalkingData研发副总裁 闫志涛

本译文禁止商用,转载请注明来源与译者!

译者注:

随着大数据和AI的发展,传统的商业模式都在面临数字化转型的挑战。无论是金融、零售还是传统的制造业,都需要从以产品为中心转变为以客户为中心,这就需要真正的用更丰富的客户数据来了解客户,用更密切的与客户的交互来使得客户参与到产品的实现中,最终实现个性化的客户的服务和产品。在2018年,让我们真正的能够将大数据和AI的价值带给客户。

在这个数字化转型的时代,AI将会为所有类型的组织带来变化,从汽车驾驶(计算机视觉技术)到制造业(吴恩达刚刚宣布他的新的公司将会用AI改变制造业)。这些变化将使得以数据科学为核心战略的现代组织出现创新的业务模式和项目管理方式。

在这篇文章中,我将会列出新的数字化转型的主要驱动因素,以及其对社会商业模式和就业的潜在影响。在数据驱动管理决策为组织带来助力、面对新的敏捷方法而言旧方法论(高度官僚主义、僵化的边界和时间表)已经过时的背景下,组织应在保持个性的前提下尽可能迅速的适应这个浪潮。

1. 以客户为中心的产品计划

数字化转型的核心是将核心商业战略的重心从以产品、能力或者市场为中心转变为以客户为中心。企业应该以客户为中心,这是Amazon在不同领域取得成功的核心理念。以客户为中心意味着产品按需定制、连接以及共享。为了实现这一点,客户应该被视为价值创造者。公司应该意识到每个客户是整体客户网络的一部分,而不是孤立的个体。新组织的目标是更贴近客户的期望并且对这些期望进行预测,这些可以通过在社交网络或者应App中保持实时的交互,并且研究客户的行为来实现。

这个客户网络需要与产品保持持续的接触,这意味着全渠道的体验(无缝的在桌面电脑到平板电脑、手机和IoT设备之间移动),这意味着数据存在云端且可以通过每个设备进行访问,并且可以按需来访问服务。客户需要保持与公司的联结,例如公司利用产品演示或者讲故事来使得用户感觉到一直在做正确的选择。

客户应该能够按照自己的需要来定制产品。推荐引擎对于为客户提供所需的建议是非常有用的。个性化的界面、消息以及内容使得新涌现出来的品牌与经典的品牌大不相同。因此,访问、参与和定制是使得客户与公司联系在一起的必须的方法。有几种策略可以与客户建立融洽的关系:社交倾听、社交化客户服务、向网络征集想法和内容或者运营一个社区(例如iOS或者安卓开发者社区)。

让客户助力企业迈向成功的最后一步是,让客户合作参与到其所需产品的开发当中。通过如开放写作平台、众筹或者竞赛,从被动的贡献变为积极的贡献。

例如,很多金融机构通过数字化转型来推动内部生产力,主要聚焦于提高效率和降低成本。然而,这没有考虑到日益复杂化的客户对丰富、直观或者超个性化客户体验的期待。这些机构需要改变前端和后端系统,来为客户提供多样的选择和足够的价值,在几乎实时的环境中提供安全的交付。

2. 平台:赢者通吃

naCuuVhg46Q.jpeg

平台商业模式能够流行是由于采用了通过直接交互创造价值的方式。因为网络上存在给予者和获得者(例如买方和卖方),平台商业模式能够凭借大范围的迭代接触到不同类型的客户。在这种类型的平台上,网络效应会有更大的回声,并且更容易被放大。这也有附带收益,比如按需流程、速度和信任的产生(比如区块链)。

因为能够在一个地方提供所有的服务,因此不需要中介。一个主要的配送中心可以领导所有的竞争甚至可以在不同的竞争者之间合作(合作竞争)。另外随着传统的市场边界的扭曲,非对称竞争对手会产生,例如一个在线书店(Amazon)变成老牌IT公司比如IBM的竞争对手,或者在web服务领域与一个搜索引擎公司例如Google产生竞争。

但是这种新的商业模式的结果就是赢者通吃。由于轻资产、易于升级、经济高效以及梅特卡夫定律,获胜的平台将会变成市场的帕累托的头部:通过降低边际成本,数字化增加了积极的规模经济并且有利于集中生产。集中生产意味着市场落入了少数人手中,导致寡头垄断甚至是由少数玩家占主导的寡头结构。

clipboard8.png

这是一个公司将自己从一个线性供应链钢铁制造商重塑为一个金属分销的数字化平台的例子。

这导致了被称之为“超级巨星”经济的产生。这些经济体的特点是更少的就业、更少的资本资产、不平等现象加剧、大小企业之间的差距拉大以及国内和国家之间的收入的不平等。数字商品和服务的更低的分发成本进一步加深了集中化的程度。当一个新鲜事物产生,只需要生产(编写、书写或者计算)一个数字化拷贝就可以满足全球的需求。通过互联网的拷贝和交付的边际成本接近于零,然后复制、3D打印即可完成。

nQki9kggzouQ.png

Stan Shish微笑曲线

新的公司需要走到Stan Shish曲线的最后才能继续产生价值,否则他们将会分崩离析。

3. 数据是关键资产

充分挖掘新技术潜力的能力始于一家公司能够快速了解和预测客户的需要,这也是数据成为公司重要资产的原因之一。“机构或者行业越依赖于信息作为他们的核心产品,带来的变化就会更彻底”(Clay Shirky)。由于知识工作和认知过程的本质,专家预计数字化和大数据分析会严重打击基于知识的商业模型以及知识工作者,甚至比基于非知识的商业模型和体力劳动者更快。数字化和大数据分析与通常由公司和知识工作者进行的自动化信息处理任务相关,高利润和工资带来的经济刺激加速了替代的发生。

数据是知识的原材料。一些经济学家说:数据是新的石油。今天我们生活在一个非结构化数据爆炸的时代,明天将会有更多的数据产生。用户参与、交换数据、创造数据,而且他们的物品也在创造数据,因此围绕数据的交换协议将会指数级的增长(例如区块链智能合约)。

LI0q5_M9cc_g.png

数据是新的商业价值,它可以带来洞察,帮助更好的定向,在特定场景中提供个性化内容。简而言之,它是以客户为中心的战略的燃料。因此企业需要一个基于以下内容的数据战略:收集不同类型的数据,确保数据质量,利用数据做决策(数据驱动的管理决策将替代在过去被视为法则的等级决策制或者“老大说了算”),企业可以在合适的时间向合适的人提供正确的建议,这归功于云计算的价格和灵活性使得将孤立数据整合起来成为可能。

4.创新和新价值产生

“商业模式描述一个组织创造、交付和获取价值的原理”,它捕捉了任何公司的核心商业逻辑。在实践中,数字化和大数据分析挑战了许多传统行业的商业模式。数字化转型是一个文化转型。服务新的数字化客户需要新的技术。例如,快速进行实验和模拟。这个转型意味着不同部门工作人员的习惯、信仰、激励和经验的持续改变。例如将IT和市场部门混合在一起可以产生能尽快提供新服务的应用。创新生态系统概念的产生是在数字化时代交付价值的关键。正因为如此,公司需要灵活的组织结构,使用云提供的灵活平台整合能力去降低市场交付的时间。

F3-0WiW3VSlA.png

这篇文章的灵感来自于David Rogers的数字化转型手册(MIT发布的关于传统企业数字化转型的报告)、以及Cagemini发布的报告“百亿组织的发展路线图:Klöckner & Co的数字化转型报”。

  • 一 02 / 2018
  • 0
Tech

锐眼发现 | Geoffrey Hinton、Andrew Moore、吴恩达等人总结 2017 AI 大事件

作者:Steve LeVine

原文:The biggest AI stories of 2017

译者:天诺

转载于:雷锋网

雷锋网 AI 科技评论按:

近年来,人工智能似乎成为了业内讨论最广泛的科学技术,尤其是在 2017年,人工智能已然是业内关注的焦点。有的人认为,具有超级智能的机器人可以威胁人类、接管世界;也有的人觉得,人类对人工智能的恐惧被夸大了。

因此,当 2017 年即将过去的时候,外媒 Axios 对人工智能圈内的一些知名人物进行了一次采访,看看在他们的眼里,今年最重要的人工智能大事件都是些什么吧。雷锋网(公众号:雷锋网) AI 科技评论把他们的呈现介绍如下。

 Geoffrey Hinton、Andrew Moore、吴恩达等人总结 2017 AI 大事件

配图: Rebecca Zisser / Axios

Rodney Brooks,Rethink Robotics 公司创始人

对我来说,今年最重要的人工智能时间,其实是我在电视上看到的一个广告。那是在2017年12月17日礼拜天,当时电视上正在播放美国橄榄球大联盟比赛,其中一个广告是该联盟自己拍摄的,说他们正在使用机器学习技术来分析球迷的想法。广告的结尾,美国橄榄球大联盟展示了自己在亚马逊 AWS 服务上部署的机器学习技术。这是大约三个礼拜之前的一个事情,我觉得它的意义在于,现在机器学习和人工智能技术已经被「炒」的很多了,预计很快就能给橄榄球球迷带来一定影响了。

吴恩达,Landing.AI 首席执行官

AlphaGo 展现出了强大的计算和数据处理能力,但是卡纳基梅隆大学开发的德州扑克人工智能程序 Libratus 则感觉更具创新。从技术观点来看,这个结果令人感到很惊喜。

Andrew Moore,卡纳基梅隆大学计算科学学院院长

Libratus AI 战胜了四位顶级德州扑克选手,这次胜利是非常重要的,因为这意味着人工智能技术有了极大的提升,已经可以考虑对手可能故意采用误导等手段了。在一个对信息真实性审查越来越严格的世界里,我们看到新一代人工智能对原始事实开始表现出怀疑,这真的是太神奇了。

Geoffrey Hinton,多伦多大学

我认为,2017年,人工智能在很多方面都取得了很大的进展,但是却没什么突破,比如 2014 年就开始说要在机器翻译里应用神经网络,而 AlphaGo 其实也是2016年的。

在我看来,令人印象最深刻的事情有这么几个:

  1. 神经架构搜索:它使用神经网络实现自动化设计神经网络的「黑魔法」,现在已经开始应用了;
  2. 使用注意力的机器翻译,无需循环神经网络或卷积;
  3. 围棋领域里的 AlphaGo 升级版 AlphaGo Zero,它很快就学会了如何以人类的方式下围棋,而且已经成为了目前最好的人工智能围棋引擎。

Greg Diamos,百度高级研究员

今年,给我印象最深刻的就是斯坦福大学的研究人员团队,他们开发出了首个人工智能「放射科医生」,它可以检测心律失常,然后告知人类医师检测结果。我认为,随着技术的发展,人工智能在医疗领域里的应用会越来越多,这令我感到非常惊讶。

Azeem Azhar,Peer Index 创始人 The Exponential View 策展人

2017 年的人工智能大事件,我会选择两件事,他们都非常重视人工智能技术的应用,而且也都能解决一些过去被人们忽视的问题。

第一个是微软研究院的凯特•克劳福德(Kate Crawford),她介绍了机器学习算法是如何出错的,这个问题会加强和扩大现有的人工智能偏见。

第二个是由剑桥大学阿德里安•维尔德(Adrian Weller)发表的一份论文,其中提到了如何建立算法系统,这些算法系统可以反映出人类对公平的直觉如何。我们必须对凯特•克劳福德和阿德里安•维尔德所提到的问题加以重视,并且刺激科技行业接受。

Terah Lyons,Partnership on AI 执行董事

今年,人工智能还是给我们带来了一些令人心痛的时刻,因为在某些边缘化问题上,人工智能的表现似乎并不太好。比如最近,Kristian Lum 就表示从事机器学习的同事有性骚扰行为,这需要在人工智能领域里引起重视,而且多样性问题绝不是一个侧面表现。

科技行业里的性别歧视似乎越来越猖獗,这对人工智能领域也非常有害,甚至会带来灾难性的后果,其中最重要的原因,就是很多排他性的设计会带来比较严重的问题,而人工智能可以很容易地把问题进一步扩大,并且延伸很多糟糕的人类偏见。

我们所有人都有义务把包容性作为创新首选,特别是在人工智能这样一个有潜力带来巨大利益的领域。2018 年,在人工智能尝试解决的所有重大挑战中,包容性应该是要排在第一位的。

Been Kim,谷歌大脑研究科学家

今年,我认为比较受欢迎的最大趋势,是人工智能可以尝试应对一些可解释性的问题,这意味着我们有了一种可以帮助人类理解人工智能模型的方法。

在今年举办的 ICML 上,就设置了人工智能解释性教程和一些相关的研讨会。此外,在 NIPS 大会上,也有研讨会和人工智能解释性的介绍,明年 CVPR 大会和 FATML 会议也都会有相关议程。

Richard Socher, Salesforce首席科学家

也许,2017年最令我感到印象深刻的事情,就是来自于本月初召开的 NIPS 大会上。伦理,成为了人工智能研究领域里最令人印象深刻的核心主题之一。我有必要提醒大家,人工智能是否能够获得成功,重点在于信任、透明和平等的价值观。

 

  • 十二 18 / 2017
  • 0
Tech

锐眼发现 | 促进新一代人工智能产业发展三年行动计划

原文:工业和信息化部关于印发《促进新一代人工智能产业发展三年行动计划(2018-2020年)》的通知

 

促进新一代人工智能产业发展三年行动计划

(2018-2020年)

当前,新一轮科技革命和产业变革正在萌发,大数据的形成、理论算法的革新、计算能力的提升及网络设施的演进驱动人工智能发展进入新阶段,智能化成为技术和产业发展的重要方向。人工智能具有显著的溢出效应,将进一步带动其他技术的进步,推动战略性新兴产业总体突破,正在成为推进供给侧结构性改革的新动能、振兴实体经济的新机遇、建设制造强国和网络强国的新引擎。为落实《新一代人工智能发展规划》,深入实施“中国制造2025”,抓住历史机遇,突破重点领域,促进人工智能产业发展,提升制造业智能化水平,推动人工智能和实体经济深度融合,制订本行动计划。

一、总体要求

(一)指导思想

全面贯彻落实党的十九大精神,以习近平新时代中国特色社会主义思想为指导,按照“五位一体”总体布局和“四个全面”战略布局,认真落实党中央、国务院决策部署,以信息技术与制造技术深度融合为主线,推动新一代人工智能技术的产业化与集成应用,发展高端智能产品,夯实核心基础,提升智能制造水平,完善公共支撑体系,促进新一代人工智能产业发展,推动制造强国和网络强国建设,助力实体经济转型升级。

(二)基本原则

系统布局。把握人工智能发展趋势,立足国情和各地区的产业现实基础,顶层引导和区域协作相结合,加强体系化部署,做好分阶段实施,构建完善新一代人工智能产业体系。

重点突破。针对产业发展的关键薄弱环节,集中优势力量和创新资源,支持重点领域人工智能产品研发,加快产业化与应用部署,带动产业整体提升。

协同创新。发挥政策引导作用,促进产学研用相结合,支持龙头企业与上下游中小企业加强协作,构建良好的产业生态。

开放有序。加强国际合作,推动人工智能共性技术、资源和服务的开放共享。完善发展环境,提升安全保障能力,实现产业健康有序发展。

(三)行动目标

通过实施四项重点任务,力争到2020年,一系列人工智能标志性产品取得重要突破,在若干重点领域形成国际竞争优势,人工智能和实体经济融合进一步深化,产业发展环境进一步优化。

——人工智能重点产品规模化发展,智能网联汽车技术水平大幅提升,智能服务机器人实现规模化应用,智能无人机等产品具有较强全球竞争力,医疗影像辅助诊断系统等扩大临床应用,视频图像识别、智能语音、智能翻译等产品达到国际先进水平。

——人工智能整体核心基础能力显著增强,智能传感器技术产品实现突破,设计、代工、封测技术达到国际水平,神经网络芯片实现量产并在重点领域实现规模化应用,开源开发平台初步具备支撑产业快速发展的能力。

——智能制造深化发展,复杂环境识别、新型人机交互等人工智能技术在关键技术装备中加快集成应用,智能化生产、大规模个性化定制、预测性维护等新模式的应用水平明显提升。重点工业领域智能化水平显著提高。

——人工智能产业支撑体系基本建立,具备一定规模的高质量标注数据资源库、标准测试数据集建成并开放,人工智能标准体系、测试评估体系及安全保障体系框架初步建立,智能化网络基础设施体系逐步形成,产业发展环境更加完善。

二、培育智能产品

以市场需求为牵引,积极培育人工智能创新产品和服务,促进人工智能技术的产业化,推动智能产品在工业、医疗、交通、农业、金融、物流、教育、文化、旅游等领域的集成应用。发展智能控制产品,加快突破关键技术,研发并应用一批具备复杂环境感知、智能人机交互、灵活精准控制、群体实时协同等特征的智能化设备,满足高可用、高可靠、安全等要求,提升设备处理复杂、突发、极端情况的能力。培育智能理解产品,加快模式识别、智能语义理解、智能分析决策等核心技术研发和产业化,支持设计一批智能化水平和可靠性较高的智能理解产品或模块,优化智能系统与服务的供给结构。推动智能硬件普及,深化人工智能技术在智能家居、健康管理、移动智能终端和车载产品等领域的应用,丰富终端产品的智能化功能,推动信息消费升级。着重在以下领域率先取得突破:

(一)智能网联汽车。支持车辆智能计算平台体系架构、车载智能芯片、自动驾驶操作系统、车辆智能算法等关键技术、产品研发,构建软件、硬件、算法一体化的车辆智能化平台。到2020年,建立可靠、安全、实时性强的智能网联汽车智能化平台,形成平台相关标准,支撑高度自动驾驶(HA级)。

(二)智能服务机器人。支持智能交互、智能操作、多机协作等关键技术研发,提升清洁、老年陪护、康复、助残、儿童教育等家庭服务机器人的智能化水平,推动巡检、导览等公共服务机器人以及消防救援机器人等的创新应用。发展三维成像定位、智能精准安全操控、人机协作接口等关键技术,支持手术机器人操作系统研发,推动手术机器人在临床医疗中的应用。到2020年,智能服务机器人环境感知、自然交互、自主学习、人机协作等关键技术取得突破,智能家庭服务机器人、智能公共服务机器人实现批量生产及应用,医疗康复、助老助残、消防救灾等机器人实现样机生产,完成技术与功能验证,实现20家以上应用示范。

(三)智能无人机。支持智能避障、自动巡航、面向复杂环境的自主飞行、群体作业等关键技术研发与应用,推动新一代通信及定位导航技术在无人机数据传输、链路控制、监控管理等方面的应用,开展智能飞控系统、高集成度专用芯片等关键部件研制。到2020年,智能消费级无人机三轴机械增稳云台精度达到0.005 度,实现 360 度全向感知避障,实现自动智能强制避让航空管制区域。

(四)医疗影像辅助诊断系统。推动医学影像数据采集标准化与规范化,支持脑、肺、眼、骨、心脑血管、乳腺等典型疾病领域的医学影像辅助诊断技术研发,加快医疗影像辅助诊断系统的产品化及临床辅助应用。到2020年,国内先进的多模态医学影像辅助诊断系统对以上典型疾病的检出率超过95%,假阴性率低于1%,假阳性率低于5%。

(五)视频图像身份识别系统。支持生物特征识别、视频理解、跨媒体融合等技术创新,发展人证合一、视频监控、图像搜索、视频摘要等典型应用,拓展在安防、金融等重点领域的应用。到2020年,复杂动态场景下人脸识别有效检出率超过97%,正确识别率超过90%,支持不同地域人脸特征识别。

(六)智能语音交互系统。支持新一代语音识别框架、口语化语音识别、个性化语音识别、智能对话、音视频融合、语音合成等技术的创新应用,在智能制造、智能家居等重点领域开展推广应用。到2020年,实现多场景下中文语音识别平均准确率达到96%,5米远场识别率超过92%,用户对话意图识别准确率超过90%。

(七)智能翻译系统。推动高精准智能翻译系统应用,围绕多语言互译、同声传译等典型场景,利用机器学习技术提升准确度和实用性。到2020年,多语种智能互译取得明显突破,中译英、英译中场景下产品的翻译准确率超过85%,少数民族语言与汉语的智能互译准确率显著提升。

(八)智能家居产品。支持智能传感、物联网、机器学习等技术在智能家居产品中的应用,提升家电、智能网络设备、水电气仪表等产品的智能水平、实用性和安全性,发展智能安防、智能家具、智能照明、智能洁具等产品,建设一批智能家居测试评价、示范应用项目并推广。到2020年,智能家居产品类别明显丰富,智能电视市场渗透率达到90%以上,安防产品智能化水平显著提升。

三、突破核心基础

加快研发并应用高精度、低成本的智能传感器,突破面向云端训练、终端应用的神经网络芯片及配套工具,支持人工智能开发框架、算法库、工具集等的研发,支持开源开放平台建设,积极布局面向人工智能应用设计的智能软件,夯实人工智能产业发展的软硬件基础。着重在以下领域率先取得突破:

(一)智能传感器。支持微型化及可靠性设计、精密制造、集成开发工具、嵌入式算法等关键技术研发,支持基于新需求、新材料、新工艺、新原理设计的智能传感器研发及应用。发展市场前景广阔的新型生物、气体、压力、流量、惯性、距离、图像、声学等智能传感器,推动压电材料、磁性材料、红外辐射材料、金属氧化物等材料技术革新,支持基于微机电系统(MEMS)和互补金属氧化物半导体(CMOS)集成等工艺的新型智能传感器研发,发展面向新应用场景的基于磁感、超声波、非可见光、生物化学等新原理的智能传感器,推动智能传感器实现高精度、高可靠、低功耗、低成本。到2020年,压电传感器、磁传感器、红外传感器、气体传感器等的性能显著提高,信噪比达到70dB、声学过载点达到135dB的声学传感器实现量产,绝对精度100Pa以内、噪音水平0.6Pa以内的压力传感器实现商用,弱磁场分辨率达到1pT的磁传感器实现量产。在模拟仿真、设计、MEMS工艺、封装及个性化测试技术方面达到国际先进水平,具备在移动式可穿戴、互联网、汽车电子等重点领域的系统方案设计能力。

(二)神经网络芯片。面向机器学习训练应用,发展高性能、高扩展性、低功耗的云端神经网络芯片,面向终端应用发展适用于机器学习计算的低功耗、高性能的终端神经网络芯片,发展与神经网络芯片配套的编译器、驱动软件、开发环境等产业化支撑工具。到2020年,神经网络芯片技术取得突破进展,推出性能达到128TFLOPS(16位浮点)、能效比超过1TFLOPS/w的云端神经网络芯片,推出能效比超过1T OPS/w(以16位浮点为基准)的终端神经网络芯片,支持卷积神经网络(CNN)、递归神经网络(RNN)、长短期记忆网络(LSTM)等一种或几种主流神经网络算法;在智能终端、自动驾驶、智能安防、智能家居等重点领域实现神经网络芯片的规模化商用。

(三)开源开放平台。针对机器学习、模式识别、智能语义理解等共性技术和自动驾驶等重点行业应用,支持面向云端训练和终端执行的开发框架、算法库、工具集等的研发,支持开源开发平台、开放技术网络和开源社区建设,鼓励建设满足复杂训练需求的开放计算服务平台,鼓励骨干龙头企业构建基于开源开放技术的软件、硬件、数据、应用协同的新型产业生态。到2020年,面向云端训练的开源开发平台支持大规模分布式集群、多种硬件平台、多种算法,面向终端执行的开源开发平台具备轻量化、模块化和可靠性等特征。

四、深化发展智能制造

深入实施智能制造,鼓励新一代人工智能技术在工业领域各环节的探索应用,支持重点领域算法突破与应用创新,系统提升制造装备、制造过程、行业应用的智能化水平。着重在以下方面率先取得突破:

(一)智能制造关键技术装备。提升高档数控机床与工业机器人的自检测、自校正、自适应、自组织能力和智能化水平,利用人工智能技术提升增材制造装备的加工精度和产品质量,优化智能传感器与分散式控制系统(DCS)、可编程逻辑控制器(PLC)、数据采集系统(SCADA)、高性能高可靠嵌入式控制系统等控制装备在复杂工作环境的感知、认知和控制能力,提高数字化非接触精密测量、在线无损检测系统等智能检测装备的测量精度和效率,增强装配设备的柔性。提升高速分拣机、多层穿梭车、高密度存储穿梭板等物流装备的智能化水平,实现精准、柔性、高效的物料配送和无人化智能仓储。

到2020年,高档数控机床智能化水平进一步提升,具备人机协调、自然交互、自主学习功能的新一代工业机器人实现批量生产及应用;增材制造装备成形效率大于450cm3/h,连续工作时间大于240h;实现智能传感与控制装备在机床、机器人、石油化工、轨道交通等领域的集成应用;智能检测与装配装备的工业现场视觉识别准确率达到90%,测量精度及速度满足实际生产需求;开发10个以上智能物流与仓储装备。

(二)智能制造新模式。鼓励离散型制造业企业以生产设备网络化、智能化为基础,应用机器学习技术分析处理现场数据,实现设备在线诊断、产品质量实时控制等功能。鼓励流程型制造企业建设全流程、智能化生产管理和安防系统,实现连续性生产、安全生产的智能化管理。打造网络化协同制造平台,增强人工智能指引下的人机协作与企业间协作研发设计与生产能力。发展个性化定制服务平台,提高对用户需求特征的深度学习和分析能力,优化产品的模块化设计能力和个性化组合方式。搭建基于标准化信息采集的控制与自动诊断系统,加快对故障预测模型和用户使用习惯信息模型的训练和优化,提升对产品、核心配件的生命周期分析能力。

到2020年,数字化车间的运营成本降低20%,产品研制周期缩短20%;智能工厂产品不良品率降低10%,能源利用率提高10%;航空航天、汽车等领域加快推广企业内外并行组织和协同优化新模式;服装、家电等领域对大规模、小批量个性化订单全流程的柔性生产与协作优化能力普遍提升;在装备制造、零部件制造等领域推进开展智能装备健康状况监测预警等远程运维服务。

五、构建支撑体系

面向重点产品研发和行业应用需求,支持建设并开放多种类型的人工智能海量训练资源库、标准测试数据集和云服务平台,建立并完善人工智能标准和测试评估体系,建设知识产权等服务平台,加快构建智能化基础设施体系,建立人工智能网络安全保障体系。着重在以下领域率先取得突破:

(一)行业训练资源库。面向语音识别、视觉识别、自然语言处理等基础领域及工业、医疗、金融、交通等行业领域,支持建设高质量人工智能训练资源库、标准测试数据集并推动共享,鼓励建设提供知识图谱、算法训练、产品优化等共性服务的开放性云平台。到2020年,基础语音、视频图像、文本对话等公共训练数据量大幅提升,在工业、医疗、金融、交通等领域汇集一定规模的行业应用数据,用于支持创业创新。

(二)标准测试及知识产权服务平台。建设人工智能产业标准规范体系,建立并完善基础共性、互联互通、安全隐私、行业应用等技术标准,鼓励业界积极参与国际标准化工作。构建人工智能产品评估评测体系,对重点智能产品和服务的智能水平、可靠性、安全性等进行评估,提升人工智能产品和服务质量。研究建立人工智能技术专利协同运用机制,支持建设专利协同运营平台和知识产权服务平台。到2020年,初步建立人工智能产业标准体系,建成第三方试点测试平台并开展评估评测服务;在模式识别、语义理解、自动驾驶、智能机器人等领域建成具有基础支撑能力的知识产权服务平台。

(三)智能化网络基础设施。加快高度智能化的下一代互联网、高速率大容量低时延的第五代移动通信(5G)网、快速高精度定位的导航网、泛在融合高效互联的天地一体化信息网部署和建设,加快工业互联网、车联网建设,逐步形成智能化网络基础设施体系,提升支撑服务能力。到2020年,全国90%以上地区的宽带接入速率和时延满足人工智能行业应用需求,10家以上重点企业实现覆盖生产全流程的工业互联网示范建设,重点区域车联网网络设施初步建成。

(四)网络安全保障体系。针对智能网联汽车、智能家居等人工智能重点产品或行业应用,开展漏洞挖掘、安全测试、威胁预警、攻击检测、应急处置等安全技术攻关,推动人工智能先进技术在网络安全领域的深度应用,加快漏洞库、风险库、案例集等共享资源建设。到2020年,完善人工智能网络安全产业布局,形成人工智能安全防控体系框架,初步建成具备人工智能安全态势感知、测试评估、威胁信息共享以及应急处置等基本能力的安全保障平台。

六、保障措施

(一)加强组织实施

强化部门协同和上下联动,建立健全政府、企业、行业组织和产业联盟、智库等的协同推进机制,加强在技术攻关、标准制定等方面的协调配合。加强部省合作,依托国家新型工业化产业示范基地建设等工作,支持有条件的地区发挥自身资源优势,培育一批人工智能领军企业,探索建设人工智能产业集聚区,促进人工智能产业突破发展。面向重点行业和关键领域,推动人工智能标志性产品应用。建立人工智能产业统计体系,关键产品与服务目录,加强跟踪研究和督促指导,确保重点工作有序推进。

(二)加大支持力度

充分发挥工业转型升级(中国制造2025)等现有资金以及重大项目等国家科技计划(专项、基金)的引导作用,支持符合条件的人工智能标志性产品及基础软硬件研发、应用试点示范、支撑平台建设等,鼓励地方财政对相关领域加大投入力度。以重大需求和行业应用为牵引,搭建典型试验环境,建设产品可靠性和安全性验证平台,组织协同攻关,支持人工智能关键应用技术研发及适配,支持创新产品设计、系统集成和产业化。支持人工智能企业与金融机构加强对接合作,通过市场机制引导多方资本参与产业发展。在首台(套)重大技术装备保险保费补偿政策中,探索引入人工智能融合的技术装备、生产线等关键领域。

(三)鼓励创新创业

加快建设和不断完善智能网联汽车、智能语音、智能传感器、机器人等人工智能相关领域的制造业创新中心,设立人工智能领域的重点实验室。支持企业、科研院所与高校联合开展人工智能关键技术研发与产业化。鼓励开展人工智能创新创业和解决方案大赛,鼓励制造业大企业、互联网企业、基础电信企业建设“双创”平台,发挥骨干企业引领作用,加强技术研发与应用合作,提升产业发展创新力和国际竞争力。培育人工智能创新标杆企业,搭建人工智能企业创新交流平台。

(四)加快人才培养

贯彻落实《制造业人才发展规划指南》,深化人才体制机制改革。以多种方式吸引和培养人工智能高端人才和创新创业人才,支持一批领军人才和青年拔尖人才成长。依托重大工程项目,鼓励校企合作,支持高等学校加强人工智能相关学科专业建设,引导职业学校培养产业发展急需的技能型人才。鼓励领先企业、行业服务机构等培养高水平的人工智能人才队伍,面向重点行业提供行业解决方案,推广行业最佳应用实践。

(五)优化发展环境

开展人工智能相关政策和法律法规研究,为产业健康发展营造良好环境。加强行业对接,推动行业合理开放数据,积极应用新技术、新业务,促进人工智能与行业融合发展。鼓励政府部门率先运用人工智能提升业务效率和管理服务水平。充分利用双边、多边国际合作机制,抓住“一带一路”建设契机,鼓励国内外科研院所、企业、行业组织拓宽交流渠道,广泛开展合作,实现优势互补、合作共赢。

  • 十二 05 / 2017
  • 0
Tech

锐眼发现 | DeepMind 16篇NIPS 2017论文,全部信息都在这里了

作者:岑大师

转载于:雷锋网

本文转自雷锋网,如需转载请至雷锋网官网申请授权。

 

雷锋网按:作为人工智能领域的“领头羊”,DeepMind的最新研究总是能引起大家的关注。那么在即将在加州长滩召开的机器学习领域顶级会议NIPS 2017上,DeepMind又会给我们带来什么样的先知卓见呢?雷锋网为你整理了DeepMind在NIPS 2017上的论文,便于大家按自己感兴趣的内容按图索骥。一起来看一下:

第1天 12月4日 2Poster

论文1:《Robust imitation of diverse behaviours

作者:Ziyu Wang,Josh Merel,Greg Wayne,Nando de Freitas,Scott Reed,Nicolas Heess

摘要:我们提出了一个建立在最先进的生成模型上的神经网络架构,该架构能够学习不同行为之间的关系,并模仿它所显示的具体行为。训练结束后,我们的系统可以编码一个单一的观察动作,并根据这个演示创建一个新的小动作。它也可以在不同类型的行为(如步行的不同风格)之间切换,尽管之前并没有看到过这种切换。

DeepMind 16篇NIPS 2017论文,全部信息都在这里了  | NIPS 2017

(上面的小人切换步行风格像不像在跳舞?)

展示时间/地点:Pacific Ballroom #143,Poster环节,6:30-22:30

论文2:《Sobolev training for neural networks

作者:Wojtek Czarnecki,Simon Osindero,Max Jaderberg,GrzegorzŚwirszcz,Razvan Pascanu

摘要:本文给出了一种将目标函数导数的知识纳入深度神经网络训练的简单方法。我们证明最近的基于ReLU的体系结构非常适合这样的任务,并评估它们在三个问题即低维回归,政策蒸馏和合成梯度训练上的有效性。我们观察到训练的效率尤其是在低数据情况下显著提高,并且以接近最新的准确度训练了第一个基于梯度的合成的ImageNet模型。

展示时间/地点:Pacific Ballroom #139,Poster环节,6:30-22:30

第2天 12月5日 4Poster

论文3:《Filtering variational objectives

作者:Chris J. Maddison,Dieterich Lawson,George Tucker,Nicolas Heess,Mohammad Norouzi,Andriy Mnih,Arnaud Doucet,Yee Whye Teh

摘要:我们考虑将变分的下界扩展到基于粒子滤波的边界似然估计器(雷锋网注:主要特指估算概率分布)定义的下界族群。这些过滤目标可以利用模型的顺序结构在深生成模型中形成更紧密的界限和更好的模型学习目标。在我们的实验中,我们发现用滤波目标进行训练比使用变分下限训练相同的模型体系结构有了实质性的改进。

展示时间/地点:Pacific Ballroom #114,Poster环节,6:30-22:30

论文4:《Visual interaction networks: Learning a physics simulator from video

作者:Nicholas Watters,Andrea Tacchetti,Theophane Weber,Razvan Pascanu,Peter Battaglia,Daniel Zoran

摘要:在这项研究中我们提出了一种基于神经网络的模型”视觉交互网络“(VIN),在没有先验知识的情况下学习物理动力学。 VIN能够从几帧视频中推断出多个物理对象的状态,然后用这些来预测对象位置。它还能够推断隐形物体的位置,并学习依赖于物体属性(如质量)的动力原理。

DeepMind 16篇NIPS 2017论文,全部信息都在这里了  | NIPS 2017

由VIN(右)预测的动力学与真实模拟(左)相比较

展示时间/地点:Pacific Ballroom #123,Poster环节,6:30-22:30

论文5:《Neural discrete representation learning

作者:Aäronvan den Oord,Oriol Vinyals,Koray Kavukcuoglu

摘要:在没有监督的情况下学习有用的陈述仍然是机器学习中的关键挑战。这项研究中,我们提出了一个简单而强大的生成模型,该模型被称为矢量量化变分自动换能器(VQ-VAE)以学习这种离散表征。当这些表征与先前的自回归配对时,该模型能够生成高质量的图像,视频和语音以及进行高质量的扬声器转换。

展示时间/地点:Pacific Ballroom #116,Poster环节,6:30-22:30

论文6:《Variational memory addressing in generative models

作者:JörgBornschein,Andriy Mnih,Daniel Zoran,Danilo Jimenez Rezende

摘要:基于注意力的记忆可用于增强神经网络,并被用于Few-shot learning、快速适应性、更普遍地支持非参数扩展等领域。不同于目前流行的可区分的软注意机制,我们使用随机的硬注意力来生成模型中的记忆内容,这使得我们可以将变分推理应用于内存寻址,使用目标信息获得更精确的内存查找,尤其是在内存缓冲区大且内存条目混杂的模型中。

展示时间/地点:Pacific Ballroom #117,Poster环节,6:30-22:30

第3天 12月6日 2 Oral/4 Spotlight/4Poster

论文7:《REBAR: Low-variance, unbiased gradient estimates for discrete latent variable models

作者:George Tucker, Andriy Mnih, Chris J Maddison, Dieterich Lawson, Jascha Sohl-Dickstein

摘要:由于具有高方差梯度估计量,对具有离散潜变量的模型进行学习具有挑战性。 之前的方法要么产生高方差/无偏梯度,或低方差/有偏差的梯度。 REBAR使用控制变量和重新参数化技巧来获得两者中最好的结果:低方差/无偏差的梯度,使得收敛更快,效果更好。

展示时间/地点:Hall A,10:35-10:50,Oral讲解;

Pacific Ballroom #178,Poster环节,6:30-22:30

论文8:《Imagination-augmented agents for deep reinforcement learning

作者:Sébastien Racanière, Théophane Weber, David P. Reichert, Lars Buesing, Arthur Guez, Danilo Rezende, Adria Puigdomènech Badia, Oriol Vinyals, Nicolas Heess, Yujia Li, Razvan Pascanu, Peter Battaglia, Demis Hassabis, David Silver, Daan Wierstra.

摘要:我们描述了一个基于想象力的规划方法的新族类,并介绍了为智能体学习和构建计划,从而最大化任务效率提供新方法的架构。 这些架构对于复杂和不完善的模型是有效的,稳健的,并且可以采取灵活的策略来扩展他们的想象力。 我们介绍的智能体受益于一个“想象编码器”,这是一个神经网络,它学习提取任何对未来决策有用的信息,但忽略那些不相关的信息。

DeepMind 16篇NIPS 2017论文,全部信息都在这里了  | NIPS 2017

图为智能体进行飞船任务游戏。该游戏必须激活一定次数的推进器以稳定飞行器。红色表示执行的轨迹,蓝色和绿色表示想象的轨迹。

展示时间/地点:Hall A,15:05-15:20,Oral讲解;

Pacific Ballroom #139,Poster环节,6:30-22:30

论文9:《A simple neural network module for relational reasoning

作者:Adam Santoro, David Raposo, David Barrett, Mateusz Malinowski, Razvan Pascanu, Peter Battaglia, Timothy Lillicrap

摘要:我们演示了使用简单的即插即用神经网络模块来解决需要复杂关系推理的任务。 这个称为“关系网络”的模块可以接收非结构化的输入,比如图像或故事,并隐含地推理其中包含的关系。

展示时间/地点:Hall A,15:25-15:30,Spotlight讲解;

Pacific Ballroom #139,Poster环节,6:30-22:30

论文10:《Simple and scalable predictive uncertainty estimation using deep ensembles

作者:Balaji Lakshminarayanan, Alexander Pritzel, Charles Blundell

摘要:量化神经网络(NN)中的预测不确定性是一个具有挑战性但尚未解决的问题。 大部分工作集中在贝叶斯解决方案上,但这些方案都是计算密集型的,需要对训练管道进行重大修改。我们提出了一种贝叶斯神经网络的替代方案,该方案易于实现和并行,只需要很少的超参数调整,并产生高质量的预测不确定性估计。 通过一系列关于分类和回归基准的实验,我们证明了我们的方法可产生良好校准的不确定性估计,其与近似贝叶斯神经网络一样好或更好。

展示时间/地点:Hall A,15:45-15:50,Spotlight讲解;

Pacific Ballroom #133,Poster环节,6:30-22:30

论文11:《Natural value approximators: learning when to trust past estimates

作者:Zhongwen Xu, Joseph Modayil, Hado van Hasselt, Andre Barreto, David Silver, Tom Schaul

摘要:基于随输入而平滑变化观察的典型近似值,我们重新回顾了RL的价值逼近器的结构,但是当到达奖励值时真值会突然发生变化。 我们提出的方法使用插值与预测值估计,用于适应这种不对称的不连续性。

展示时间/地点:Hall A,17:25-17:30,Spotlight讲解;

Pacific Ballroom #6,Poster环节,6:30-22:30

论文12: 《Successor features for transfer in reinforcement learning

作者:Andre Barreto, Will Dabney, Remi Munos, Jonathan Hunt, Tom Schaul, David Silver, Hado van Hasselt

摘要:我们提出了一个强化学习的转移框架。 我们的方法取决于两个关键的观点:1)“继承者特征”,这是一种价值函数表示,将环境的动态与回报分离开来;2)“广义的政策改进”,一种考虑了一整套策略的一般化的动态规划策略改进步骤。 综合起来,这两个想法导致了一种无缝集成在强化学习框架内的方法,并允许在任务之间不受任何限制地进行转移。

展示时间/地点:Hall A,17:40-17:45,Spotlight讲解;

Pacific Ballroom #9,Poster环节,6:30-22:30

论文13:《Deep reinforcement learning from human preferences

作者:Paul Christiano (Open AI), Jan Leike, Tom B. Brown, Miljan Martic, Shane Legg, Dario Amodei (Open AI)

摘要:人工智能安全的一个核心问题是如何告诉一个算法我们希望它做什么。 OpenAI展示了一个全新的系统,允许没有技术经验的人员教AI如何执行一个复杂的任务,如操纵模拟机器人手臂。

DeepMind 16篇NIPS 2017论文,全部信息都在这里了  | NIPS 2017

通过900个人的反馈教会了这个算法后空翻。

展示时间/地点:Pacific Ballroom #1,Poster环节,6:30-22:30

论文14:《A multi-agent reinforcement learning model of common-pool resource appropriation

作者:Julien Perolat, Joel Z Leibo, Vinicius Zambaldi, Charles Beattie, Karl Tuyls, Thore Graepel

摘要:本文考察了共同资源占用问题的复杂性。 如渔业,放牧牧场或淡水的系统,许多人或行为者可以获得相同的资源。 社会科学的传统模式往往表明,获得资源的各方以自利的方式行事,最终导致不可持续的资源枯竭。 但我们在人类社会的实际经验知道可能会产生很多中可能的结果。 像渔业这样的资源,有时候会被过度开发,有时可以可持续地收获。 在这项研究中,我们提出了可用于研究的新建模技术,旨在解释我们在现实世界中观察到的与传统模型预测的差距。

展示时间/地点:Pacific Ballroom #86,Poster环节,6:30-22:30

论文15:《DisTraL: Robust multitask reinforcement learning

作者:Yee Whye Teh, Victor Bapst, Wojciech Czarnecki, John Quan, James Kirkpatrick, Raia Hadsell, Nicholas Heess, Razvan Pascanu

摘要:我们开发了一个强化多任务学习的方法。 我们的假设是,任务是彼此相关的(例如处于相同的环境或具有相同的物理特性),好的动作序列倾向于在任务中重复出现。 我们的方法通过将特定于任务的策略同时提炼为一个通用的默认策略,并通过将所有特定于任务的策略规则化为违约策略来跨这些任务转移这些常识。 我们的研究表明,这会导致更快、更强大的学习。

展示时间/地点:Pacific Ballroom #138,Poster环节,6:30-22:30

论文16:《A unified game-theoretic approach to multiagent reinforcement learning

作者:Marc Lanctot, Vinicius Zambaldi, Audrunas Gruslys, Angeliki Lazaridou, Karl Tuyls, Julien Perolat, David Silver, Thore Graepel

摘要:在这项研究中,我们首先观察到独立强化学习者产生可以共同关联但在执行过程中未能与其他主体进行良好的概括的策略。 我们通过提出一个称为联合策略关联的新度量来量化这种影响,然后我们提出了一个由博弈论基础所推动的算法,该算法概括了虚拟游戏,迭代最佳响应,独立RL和双重预言等几种方法。 我们的研究表明,我们的算法可以在第一人称协调游戏中显着降低联合策略的相关性,并在普通的扑克基准游戏中找到稳健的反策略。

展示时间/地点:Pacific Ballroom #203,Poster环节,6:30-22:30

  • 十一 23 / 2017
  • 0
Ideas

锐眼洞察 | iOS的未来是AI(翻译)

作者:Svilen Kostadinov

原文:Why Artificial Intelligence Is the Future of iPhone’s iOS

译者:TalkingData首席架构师 黄洋成(YC)

本译文禁止商用,转载请注明来源与译者!

 

自十年前首次亮相以来,iPhone已经发生了翻天覆地的变化:运行速度有了指数级的提升,屏幕和相机在各种指标上都有了很大的提升(初代iPhone甚至无法录制视频),而外形也已经完善, 还不断增加新的传感器。 虽然苹果的工业设计在制造业不断开创新领域,但其软件多年来一直处于低谷。

智能手机,傻操作系统

当然,功能和美学都有了明显的改善,但除了(被史蒂夫·乔布斯强烈反对的)App Store之外,iOS 1和iOS 11之间的体验差异并不是很大:

无论是白天还是夜晚,在家或在国外使用iPhone,你每天收到哪些朋友的信息,你在午休时玩的是什么游戏,或者你家中有什么智能设备 – 只要你解锁手机,就会被置于相同的静态多屏应用图标网格中。

更过分的是,应用程序的管理和分组的负担也要留给用户,让他们依靠肌肉记忆来找到App的位置。

 

“数字化体验应该动态适应用户需求”的想法其实并不新鲜:

  1. Netflix推荐你可能感兴趣的电影、你会继续观看的节目、最新播出的节目、节目的流派/分类等
  2. 亚马逊向你推荐你最近搜索的商品、搭配购买的商品、打折促销的商品等
  3. Spotify根据你的口味组织个性化的播放列表

对于苹果来说,他们也已经开始在往这个方向走,比如Siri的联系人和应用程序建议,在锁屏上基于地理位置的应用程序建议(不知道它是否仍然存在于iOS 11):

但哪怕只是在正确的地点和时间推荐正确的应用程序的能力现在似乎都还没有。 根据帕累托原则,80%的时间里我们只使用应用程序20%的功能。

Facebook就是一个很好的例子:它包含了从信息流和视频,到故事、市场、群组、趋势新闻、天气、游戏和城市指南等所有内容。 但是,所有这些功能中,我敢打赌,超过80%的时间用户只是使用信息流。

所以,相对于推荐Facebook这个App,为什么不直接推荐信息流?你可能在想,单个功能如何模块化? 其实苹果也有一个潜在的解决方案——部件化。

   

 

不幸的是,组件化屏幕与主屏幕出现相同的问题:它只是一个静态库存列表。

具有讽刺意味是,新的iPhone有一个专用的A.I.处理器,但iOS的使用体验并没有从你的使用模式或偏好中学到什么。 但如果iPhone做到了呢?

如果你的手机了解你在何时何地、出于何种原因、使用何种功能,会怎样?

在2015年初,我在几个常见的场景中探索了一个以部件化为中心的iOS概念:

机器学习有可能使iPhone真正智能化、能够学习我们使用手机的上下文和环境。 更进一步,通过将地理位置、邻近的朋友、环境光线、噪音水平和Apple Watch采集的生命体征等因素关联起来,将带来全新的体验和服务。

下一代移动操作系统

Google似乎验证了这种动态交互的范式。在2017年,Google披露了他们实验性移动操作系统FUCHSIA的一瞥; 虽然迄今为止我们仍对它知之甚少,但它主要的前提似乎是围绕类似于部件化的模块,围绕用户的需求进行智能化安排:https://youtu.be/dziInGrVHac

无论部件化是否是正确的解决方案,有一点是明确的:随着世界动态性不断增强,我们需要更流畅、更无缝的手机和智能手表体验。 是时候重新思考我们与设备互动的基本方式了,因为静态应用范例的可用性已经在不断增长的苹果生态系统中达到了极限。

  • 十一 20 / 2017
  • 0
Ideas

锐眼发现 | 四大趋势,九大方向:14位UC Berkeley人工智能专家眼中的未来人工智能系统

作者:Ion Stoica, Dawn Song, Raluca Ada Popa, David A. Patterson, Michael W. Mahoney, Randy H. Katz, Anthony D. Joseph, Michael Jordan, Joseph M. Hellerstein, Joseph Gonzalez, Ken Goldberg, Ali Ghodsi, David E. Culler and Pieter Abbeel.

原文:A Berkeley View of Systems Challenges for AI

转载自:雷锋网(本文转自雷锋网,如需转载请至雷锋网官网申请授权)

雷锋网按:近日,UC Berkeley电气工程与计算机科学系(EECS)14位专家联合发布了一份名为《A Berkeley View of Systems Challenges for AI》的报告。这是继去年斯坦福的“AI 100”项目发布《Artificial Intelligence and life in 2030》(2030年的人工智能与生活)报告后,又一家殿堂级的大学对于人工智能未来的思考。

雷锋网发现,相比起斯坦福的报告,伯克利的报告更偏重可执行性,在报告中伯克利从自己的优势学科出发(伯克利计算机系统全美排行第一)明确提出,下一代人工智能系统的问题需要通过体系结构、软件和算法的协同创新来实现,而伯克利也将在从所面临的四大趋势和九大挑战/机会出发,来解决这些问题。

以下是雷锋网的摘录,完整报告可通过下面的地址进行阅读:http://www2.eecs.berkeley.edu/Pubs/TechRpts/2017/EECS-2017-159.pdf

 

前言

随着计算机视觉,语音识别和机器翻译系统日益商品化,以及数字广告和智能基础设施等基于学习的后端技术的广泛部署,AI(人工智能)已经从研究实验室转向生产。前所未有的数据和计算水平,机器学习方法的进步,系统软件和体系结构的创新,以及这些技术的广泛可用性使这些变化成为可能。

下一代AI系统有望加速这些发展,并通过频繁的交互和代表我们(通常是任务关键型)的决定(通常在高度个性化的环境中)来加速这些发展并对我们的生活产生越来越大的影响。然而,实现这一承诺会带来令人生畏的挑战。特别是,我们需要人工智能系统,能够在不可预测的环境中做出及时、安全的决策,这对复杂的对手来说是强大的,并且可以在不影响机密性的情况下处理越来越多的组织和个人的数据。这些挑战将因摩尔定律的结束而加剧,这将限制这些技术可以存储和处理的数据量。在本文中,我们提出了几个开放的系统,架构和安全研究方向,可以解决这些挑战,并有助于解开AI改善生活和社会的潜力。

关键词:AI,Machine Learning,Systems,Security

四大趋势,九大方向:14位UC Berkeley人工智能专家眼中的未来人工智能系统

引言

自从上个世纪60年代,模拟人类智能的构想被提出以来,人工智能已经演化成为一种被广泛应用的工程技术,它利用算法和数据,解决包括模式识别、学习、决策等广泛的问题,人工智能越来越多地与其他工程和科学相交叉,成为跨计算领域的一门技术。

尤其在计算机系统这一近年来推动了人工智能技术的发展的领域,并行硬件和高扩展性软件系统促进了机器学习框架和算法的发展,使人工智能可以处理大规模的真实世界问题。存储设备成本的降低、众包技术、移动APP、物联网以及竞争性数据的优势促进了数据处理系统和人工智能技术的进一步发展。这带来的影响是:基于人工智能的解决方案已经接近甚至超过了人类,成熟的人工智能技术不仅为网络搜索、高速交易和电子商务等现有行业提供支持,还大大促进了物联网、增强现实、生物技术、自动驾驶等新兴产业的发展。

这些应用,如无人机、机器人手术、医疗诊断和治疗、虚拟助手等,都需要人工智能系统与真实世界进行交互来决策。由于现实世界在不断变化,有时后这种变化出人意料,这些应用需要支持持续学习或终身学习、以及永动学习。终身学习系统旨在通过高效地转移和利用已有知识来解决多种任务,同时最大程度降低突发性遗忘问题,而永动学习每次迭代关注一组任务,这个任务的边界不断变大,并在不断迭代中逐步提高处理问题的质量。

为了满足以上这些需求,我们面临着诸多艰巨的挑战,例如:如何积极探索动态变化的环境、如何在存在噪音和未预见的输入情况下做出安全和鲁棒性的决策、如何使得决策可解释、如何设计新的简化应用系统构建得模块化架构,等等。此外,由于摩尔定律的终结,人们不能再寄希望于计算和存储能力的倍增来解决下一代人工智能系统的问题。

解决这些难题需要架构、软件和算法的协同创新。本文并不讨论特定的人工智能算法和技术,而是分析系统方面的研究对人工智能技术发展的重要性,提出若干有意义的系统方面的研究方向。

人工智能成功的背后因素

在过去的二十年中,人工智能的进步可用“完美风暴”来形容。有三个原因导致了人工智能的进步:1)大数据,2)高扩展性的计算机和软件系统,3)上述技术的广泛应用。这些趋势使得人工智能的核心算法和体系结构,如深度学习、贝叶斯推理得以在空前的规模和领域进行问题的探索。

趋势与挑战

人工智能已经开始改变了许多应用领域。展望未来,我们预计人工智能将更广泛地推动更多领域的发展,包括:医疗保健、交通、制造、国防、娱乐、能源、农业、销售等。大规模系统和机器学习框架已经帮助在人工智能的发展中取得了举足轻重的作用,我们预计计算机系统将可以更进一步地广泛促进人工智能的发展,为实现这一目标,我们需要考虑如下几个人工智能发展的趋势:

  • 关键性任务的人工智能。挑战:设计一个通过动态环境交互来持续学习、同时做出及时决策的、稳定、安全的人工智能系统。
  • 个性化人工智能。挑战:设计一个可以实现个性化应用程序和服务、但不会影响用户的隐私和安全的人工智能系统。
  • 跨组织结构的人工智能。挑战:设计一个可以训练不同组织拥有的数据集、而不会影响其保密性,在这个过程中提供跨越组织结构界线的人工智能系统。
  • 满足后摩尔定律需求的人工智能。挑战:开发以满足摩尔定律时代后期AI应用的性能需求的特定领域架构和软件系统,包括:用于AI工作负载的定制芯片、在边界有效处理数据的边界云系统、以及抽象和抽样数据的对应技术。

九大研究方向

上述四大趋势和挑战又可以细分为在研究领域的九个挑战或机会,也标明了在我们眼中未来人工智能的九大研究方向。下图表示了这四大趋势和九大研究方向的对应关系。

四大趋势,九大方向:14位UC Berkeley人工智能专家眼中的未来人工智能系统

这九个研究方向包括:

持续学习(Continual learning)

鲁棒决策(Robust decisions)

可解读的决策(Explainable decisions)

安全飞地(Secure enclaves)

对抗学习(Adversarial learning)

在保密数据上共享学习(Shared learning on confidential data)

为特定领域定制的硬件(Domain specific hardware)

组件化的AI系统(Composable AI systems)

跨云端和边界的系统(Cloud-edge systems)

结论

人工智能在过去十年中取得了惊人的进步,并从实验室研究成功转化可以取代之前的大量人力和监督的商业应用。人工智能系统和机器人不仅取代了部分人类工作,而且有望挖掘人类潜力、促进新形式合作。

为了让人工智能更好地服务我们,要克服许多艰巨的挑战,当中不少挑战与系统和基础设施有关。这些挑战源于让人工智能更快、更安全、更易于解读的决策、确保这些决策在对抗多种攻击类型的学习过程中得到准确的结果,在摩尔定律终结的前提下不断提高计算能力,以及构建易于集成到现有应用程序中的系统,并且具有跨越云端和边界的处理能力。

本文总结了几个开放性的系统、架构和安全方面的研究课题。我们希望这些问题能够启发新的研究来推动人工智能的发展,使其计算能力更强,具有可解释性、安全性和可靠性。

  • 十一 17 / 2017
  • 0
Enterprise

锐眼发现 | 营销世界的 5 大剧变之 ⑤ 人工智能

作者:Scott Brinker

原文:5 Disruptions to Marketing, Part 5: Artificial Intelligence

译者:@文科生 ,宏原科技创始人

转载于:SocialBeta

上篇回顾:锐眼发现 | 营销世界的 5 大剧变之 ④ 万物皆可数字化

 

TalkingData合伙人兼执行副总裁林逸飞点评:

  1. 确保所有营销系统和触点中的数据可被获取,而且要考虑建立一个集中的数据湖
  2. 数据质量进行投资,尤其是核心的客户数据
  3. 学习系统动力学知识
  4. 为算法营销构建一套管理模式:什么需要自动化?什么需要半自动化?什么不需要自动化?
  5. 透过 AI 的视角去评估营销技术服务商的实力

 

译者前言:AlphaGo 让人工智能成为了一个到处都在谈的热词。Scott 说,他在准备这篇文章的时候感觉自己好像也跟进了这个炒作。但是,仔细读下来,我觉得本文是对于 AI 在营销领域应用最为系统而全面的思考。

让我印象最深的是 Scott 对于技术商品化的清醒认知。实际上,任何一个创新技术的热度与其商品化程度是成正比的。让 AI 能够把几十年前就开始讨论的图景变成现实,本质的突破不是算法,而是支持算法的计算力和大数据。在 AI 热潮中,MarTech 领域确实出现了一些创新的工具和应用的机会,但真正有价值的工具和应用,应该和高质量和大规模的数据紧密联系在一起。

Scott 在文章中介绍了很多 AI 的工具和应用,很多应用都已经被 Salesforce 或者 Google 这样的平台以高价收购了。国内也有很多类似的并购,这些都说明 AI 的机会是巨大的。考虑到平台时代的赢家通吃现象,纯粹的技术和工具的未来其实是有限的。对于大部分 MarTech 企业来说,技术层面的集成机会有限,但是商业层面的集成和整合,才刚刚开始。

在翻译的过程中,我不停问自己,为什么 Scott Brinker 能把这个事情说的那么清楚?逐渐的,我找到了答案。

第一, 知识结构。Scott 是计算机专业出身,会编程,他理解机器;同时他又是一个营销人,他理解营销,这二者结合起来,让他对于 Marketing Technology 的认知特别本质。我看到过很多讨论 MarTech 的文章,大部分要不就是偏向技术,要不偏向营销,只有 Scott 能够从营销的框架出发,梳理出各种技术,让人一下子就能得到一个 Big Picture.

第二, 长期的专注。Scott 关注 MarTech 不是这几年的事情,而是在十年前就开始关注这个领域。在过去十年中,不停实践,思考和总结。这让他能够看得更全面,更系统。

第三, 持续的分享。他的博客一直保持很高的更新频率,而且,不仅仅是他自己写,他还不停寻找各个领域的实践者和思考者,分享他们的观点,这其中也包括我这样在中国的爱好者。他的博客成为了这个领域的活跃实践者和思考者的平台,最终他也能够在全球范围内发起 MarTech 的国际会议。

在本文结尾,Scott 说希望《营销世界的 5 大剧变》系列文章对大家有用。整个八月,我所有夜晚和周末的空余时间都用在翻译这一系列的文章上,当然也包括一点工作时间。我的体会是,帮助实在是太大了。翻译的过程,其实是一个深度学习的过程。不仅要看明白,并且试图用中文把自己的理解清楚地表达出来,要求自己花更多时间学习和思考,甚至还需要去了解他提到的技术公司和技术术语。

对于文科生,这有点挑战,但是也是一个特别高效的、系统的概览式学习过程。哪里去找这么好的机会呢?免费的!我跟 @puting 同学说,内容工作,与其是说内容,其实更是系统的思考过程,是一个产品研发的过程。感谢 Scott Brinker 的信任,@SocialBeta 的支持,让我完成了这个近两万字的翻译。我总算在与 Scott 在上海见面之前完成了我的承诺:)

 

以上是 Shivon Zilis 和 James Cham 制作的机器智能 3.0 全景图

这是营销的 5 个剧变系列中的第五部分(如果你没有读过第一、二、三、四部分,可以点击阅读):

这五个剧变分别是:

1.    数字化转型将超越营销部门的职能范畴,重新定义 「营销」。

2.    微服务 & API(以及开源) 构成了营销基础设施的架构。

3.    纵向竞争展现出比横向竞争更大的战略性威胁。

4.    增强现实 (AR)、混合现实 (MR)、虚拟现实(VR)、物联网(IoT)、可穿戴设备、对话式界面等等,给人们带来了数字化的一切。

5.    人工智能 (AI) 让营销和商业运作的复杂性倍增。

由于对热词「过敏」,当我写下这个题目的时候,觉得自己可能会起鸡皮疙瘩。作为今年营销界流行的关键词之一,无论你遇到什么问题,都会有人告诉你解决问题的良方就是「人工智能」(AI)。(或者想把 AI 营销解决方案卖给你)

目前,对于 AI 的炒作势头也远胜于对于大数据的(尽管二者之间的关联非常紧密)。

但 AI 的确对营销产生了深远的影响可以毫不夸张地说,未来几年,AI 会以令人瞩目的方式重塑商业和营销的本质。但是,这种改变可能并不会按照有些人希望的方式来实现。

首先,让我先将有关人工智能(artificial intelligence)、机器学习(machine learning)、认知计算(cognitive computing)和机器智能(machine intelligence)等概念差异的讨论放在一边。虽然这些术语的意义不尽相同,但是,(a) 它们之间有很多的交集;(b) 就算是这些领域最前沿的研究者也在争论他们的界限所在。

考虑到我们的目的是讨论这些技术给营销带来的剧变,就让我们暂时先用「AI」的大框来装下这些概念,将 AI 定义为「过去认为只有人类才能完成的认知任务,现在让机器去承担,而且机器能比人类做得更快、更好。」(AI 效应是研究者的一个有趣的观察。)

我喜欢分析师 Ray Wang 提出的有关 AI 所能交付结果的框架

如果你在思考,AI 已经被讨论了几十年也没有今天的热度,为什么直到现在才好像一下子占领了全世界?一个简单的答案就是廉价、快速、规模化和呈指数增长的计算和云端储存能力,使得能够有效运用 AI 算法的数据和动力对于每个人来说都触手可及。

我在 MarTech 圈里听到的另一个问题是:「在未来的营销技术全景图中会不会出现一个 AI 类别?」 有这种可能性,但也可能不会。

为什么这么说呢?因为 AI 几乎已经被嵌入到营销技术领域所有的产品类别中了。当然,确实有很多纯粹的 AI 平台。但是它们像大数据、云计算平台一样,大多都是仅仅被应用在营销服务中的通用技术。

举例而言,IBM Watson 可能是当今最广为人知的 AI 平台。但营销人可能对 Equals3 这样的产品更有兴趣。Watson 在产品的幕后提供市场研究、客户细分和媒介策划服务,这一切都是根据营销的具体需求量身定制的。

几大主要的营销平台也已经在产品组合中推出了 AI 方面的创新举措,最值得注意的是:

注:Einstein 是 Salesforce 推出的人工智能 CRM 平台,可以运用于销售、服务、营销和分析等领域

注:Sensei 是 Adobe 底层的人工智能工具,利用了 Adobe 长期积累下来的大量数据和内容,从图片到影像,能够帮助人们解决在媒体素材创意过程中面临的一系列问题

注:这是 Oracle 推出的 AI 产品,基于强大的数据云和机器学习算法,支持更好的 BI 分析和决策支持

你也可以从来自 Salesforce 的这张图中,看到他们准备在具体的产品中应用 Einstein 的方式:

但是,这是否意味着较小的 MarTech 服务商会在行业的这波 AI 浪潮中出局呢?AI 会成为最终推动营销技术行业整合的催化剂吗?也许会,但是我持怀疑态度。

实际上,你可以从 MarTech 分析大牛 David Raab 在上次旧金山 MarTech 大会上分享的这张表格中看到,AI(机器智能) 让行业中各种规模的服务商得以蓬勃发展(这张图只是列表中的一部分而已)。

那么,小型 MarTech 供应商如何与「巨头」竞争呢?在很多情况下,巨头们都有自己专门的 AI 技术。但是,今天的软件开发机制使得很多人都能站在巨人的肩膀上,利用不错的开源机器学习项目——例如 TensorFlow、PredictionIO、Caffe、Vowpal Wabbit 和 Scikit-learn——在软件中加入复杂的 AI 功能。(而且还是免费的)

注:TensorFlow 是谷歌开发的第二代人工智能学习系统,可以用于语音识别,图像识别等深度学习领域

Prediction IO 是一个开源的机器学习服务器,开发工程师和数据分析师可以使用它构建智能应用程序、基于已有数据来预测用户行为,个性化推荐、发现内容等。

Caffe 是一个清晰而高效的深度学习框架,其作者是博士毕业于 UC Berkeley 的贾扬清博士

Vowpal_wabbit 是一个机器学习系统,它能推动机器学习前沿技术的学习,例如在线学习、交互学习等

scikit-learn 是一个 Python 的机器学习项目。是一个简单高效的数据挖掘和数据分析工具。

如果你想用更简单的方式在产品中加入机器学习能力,现在也有一大堆的机器学习服务产品 (MLaaS) 可供选用:

很自然,这推动了微服务 & API 的发展。软件能够以按需「服务」的方式被提供。MarTech 服务商当然也可以使用这些软件,来保持自己在 AI 时代的竞争力。

值得注意的是,这些开源的 AI 引擎也可以直接被品牌采用,将其整合到数字化产品和客户触点当中——这又会让我们看到数字化转型的完整闭环。(这里也可以体现出,营销的 5 个剧变是如何成为一个整体的)。

鉴于很多核心 AI 算法已经面向公开市场变得商品化,因此算法本身也不再是竞争优势的来源。相反,「即插即用」的 AI 战略优势主要是通过以下两种方式建立而成的:

  • 数据。差异性来源于用以训练算法的特定数据。赢得 AI 的战略竞争的关键在于数据的规模、质量、相关性和独特性。数据质量、服务和软件会变得至关重要。精确、即时,通过 API 按需提供的第二方和第三方数据市场将会繁荣。在 AI 的加持之下,大数据终于可以被充分利用了。
  • 用户界面 (UI)。AI 可以为你的数字化产品和服务带来更好的用户体验,从「在一个特定场景下预测用户想要什么」的功能,到自然语言界面(以文本和声音为基础的聊天机器人)。这当中存在着很多机会。通过 AI 用户界面,人们可以更快速、便捷地完成复杂的任务。尤其在商业场景中,与学会用那些复杂的软件相比(想想那些要花几个月学习的企业软件认证课程),我们希望这些应用让我们获取答案更容易,做事情更轻松。

这两个关键因素很可能就是 MarTech 服务商带来颠覆的来源。思考以下两个问题:哪些公司可能会在特别有价值的数据(或者数据组合)市场中取得垄断地位?(参阅:纵向竞争万物皆可数字化哪些公司能够让他们的软件灵活地利用新的数据源,适用于备选的 UI 模式?

风险投资人 Mark Suster 在最近的文章《企业软件即将到来的转变》中描述了关于对话式交互界面的机会 / 威胁。

以语音为例,如果你坚持设计一套指令供用户以提问的方式进行交互,那么用户就必须花大量的时间在如何操作上。或者,你也可以让 AI 从过去的查询记录中学习,让智能系统给出相应的搜索结果。你也许想问:「中部地区第三季度的销售预测是多少?」、「谁负责杜邦销售的预算?」,或者「请给出过去 90 天内跟 Verizon 有过沟通的团队成员名单」。

谈到聊天工具,对于企业来说的关键是让团队成员更好地协作。这个聊天工具需要有「机器人」为团队提供智能支持。当你查询「Karthick Shama 的职位是什么?」,或者「我们和 Verizon 去年达成的业务有多少?」 时,在无需人工介入的情况下,就能收到即时、准确的答案——这对于现场的团队很关键。

以上描绘的场景并非假设。在我写这篇文章的时候,营销数据软件公司 Datorama 已经发布了嵌入 Amazon Alexa 的应用程序 「事事问 Datorama」(Ask Datorama Anything)。这一波新的 MarTech AI 界面的兴起,肯定会使现有的营销技术全景图发生动摇。

那么,广义上看,是什么让 AI 为营销带来了剧变?

市面上的流行观点和我的分歧就在于此:我不相信 AI 会让营销简单化。相反,我认为 AI 会以颠覆性的方式,让营销(商业)的复杂性呈指数型增加。

可以确定的是,AI 会大大简化很多 MarTech 工具的使用体验,也会自动化大量跟营销计划相关的 「人工」 工作 。

我们从 AI 的辅助中节省下来的时间将会被重新分配,以追求更多的竞争优势。我们可以从事一些机器还不是很擅长的活动。我们也可以让更多的任务自动化,因为管理新增算法代理的边际努力会很小(但不是零)。我们还是会和现在一样努力工作,但是我们的努力将借助 AI 服务的力量被放大。

例如,考虑一下在不同触发点、服务不同细分客户的营销自动化活动。

直到现在,这项任务的复杂性还是受限于人类的局限性。我们只能跟踪到有限的规则,服务有限的细分市场,局限于有限的触发点。

但是 AI 驱动的营销自动化就不会有这样的局限性。机器会计算上千个微细分市场和微触发点,动态调整内部的 「规则」 以优化整个互动。

再强调一次,这并不是假设。以 AI 驱动的营销优化产品 Amplero 为例,它自称可以通过多臂老虎机实验,持续测试 1000 多个营销排列组合。

这给整体的营销「系统」带来的复杂性呈数量级增长,尽管很多人类营销人员并不能觉察到。

考虑到一个复杂系统的「复杂性」 是一个有关相互独立的智能体互动次数的函数。而这些 AI 代理也并非在真空中工作,他们会对所处环境中的人类或其他 AI 的反馈做出回应。(关于设备对设备(device-to-device)的互动, David Raab 有几篇非常精彩的博文:《自动驾驶汽车会自己挑选加油站吗?》《更多是对物的营销》)。

这不仅仅有关公司内部多个 AI 代理之间的互动。竞争对手也会利用 AI 来与我们对抗。客户会使用 AI 实现他们的利益最大化。其他的行业第三方机构会让 AI 代表他们在市场上运营。这些智能体相互纠缠在一起,将会引爆营销的复杂性。

你也许会问,「如果我们根本看不到那些复杂性 ,我们还需要在意吗?」

就算我们看不到这些复杂性,实际上它依然存在——而且它会对我们的生意产生实质性的影响。我们的组织所依赖的黑盒子越多(彼此用直接和间接的方式相互连接在一起),我们对于整个系统的理解和控制就越少。在客户体验中遇到算法出小差错的风险,对我们来说也是不可见的(但是会影响品牌!),我们也会碰到重大的「黑天鹅」事件,其中,AI 之间并不良性的互动会逐步升级为恶性循环。

事情是怎么出问题的?算法交易遇到的问题让我们对此有了一些认识——与无限广阔的客户体验领域相比,金融市场还是受到了更多的管控。

当然,这不意味着我们应该——或者说能够——回避 AI。AI 是一个巨大的竞争优势来源。但是我们必须承认,跟过去十年靠人工控制的数字营销相比,AI 时代的营销会有非常不同的动力机制。

对于 AI 驱动的营销,营销人应该做好如下准备:

1、 确保所有营销系统和触点中的数据可被获取,而且要考虑建立一个集中的数据湖(来自 Informatica 公司的 Franz Aman 出了一本很棒的书,以及用一系列博客文章来介绍如何构建营销数据湖)。大数据将是驱动 AI 引擎运转的燃料。

2、对数据质量进行投资,尤其是核心的客户数据。其中的一个要点就是在尽可能多的触点上对客户的身份进行匹配,这面临着技术和法规的双重挑战。谈到跨设备的身份匹配,Gartner 公司的 Martin Kihn 对此有了很好的概述(第一部分第二部分)——但是万物数字化的趋势预计会让这件事变得更加复杂。

3、学习系统动力学知识。这是理解和管理新环境中的复杂性的一种方法——尤其考虑到 AI 算法正在加快反馈循环在技术和人文领域的交集中运行和成长的速度。

4、为算法营销构建一套管理模式:什么需要自动化?什么需要半自动化?什么不需要自动化?人类如何检查和制衡 AI?如何进行异常检测(可以了解一下 Anodot)和事件升级流程?如何设计能断开反馈循环的「断路器」,避免事态发展到无法控制的局面?而且,不仅仅只是关于营销,如何在数字化转型的大背景下组织好这一切?为此,企业值得考虑设立一个首席人工智能官的角色。

5、透过 AI 的视角去评估营销技术服务商的实力。他们采用的 AI 功能或者 AI-UI 能力简化了营销人的体验了吗?他们是否集成了一个更庞大的生态系统,可以利用所提供的数据或渠道进行 AI 分析和自动化?面对 AI 领域冒出来的新机会,供应商的敏捷程度和适应性如何?供应商能用清晰直观的例子解释他们的 AI 支持方式吗?——以及所用模型的注意事项(例如:某种类型和质量的数据)?

结语

我希望《营销世界的 5 大剧变》系列文章对你有帮助,而且你也看到这五个剧变是如何彼此产生关联的。不幸的是,我没有能力为你整理出一个简单的清单(「做好这 10 件事就能赢得 2017 年诺贝尔营销奖」)。 这些挑战都很艰难,而且推动这些剧变发生的变化如地震一般,还在我们脚下继续蔓延。

但它们也是前所未有的机会。剧变就是市场的拐点,在这里,现状备受威胁,未来有待争取。问题是,你愿意成为那个抓住机会的人吗?

  • 十一 13 / 2017
  • 0
Enterprise

锐眼洞察 | 人工智能如何使电子商务更睿智(翻译)

作者:Yana Yelina

原文:How AI Is Making eCommerce Smarter

译者:TalkingData解决方案架构师 张雪倩

本译文禁止商用,转载请注明来源与译者!

 

人工智能持续加速发展,向一系列领域渗透,在银行、医疗和体育业发现新价值。
电子商务不再处于边缘化的位置,为购物者提供无缝用户体验,为零售商提供有利可图的机会。这就解释了为什么42%的零售商和电子商家都在试验、应用或是扩大他们的人工智能项目。

转变顾客互动

聊天机器人正在逐渐对电子商务进行整体改观。高德纳咨询公司预测,到2020年,85%的顾客互动将会没有人类参与,到2018年底,人工智能机器人能依据声音和脸识别客户。

确实,虚拟购物助手已经证明是一项福音,电子商务很快就接受了适应人工智能环境的挑战。

在浏览网上商店寻找想买的物品时,购物者想要的是不麻烦的过程和对自己的问题的快速反应。而且,移动商务的急剧发展提出了更高的要求,使得市场者寻找顾客参与的新途径。聊天机器人的出现,提供了一种可能的解决方法,推动了精准定制服务的发展。
人工智能是聊天机器人的核心,快速地处理大量的网站数据,包括之前的回应和顾客反馈。深度学习使得聊天机器人分析收集的信息和提取重要的概念,如图像和物品名称。借助这些数据,聊天机器人可以改善和顾客的对话。

另一种向聊天机器人提供数据的方法就是将他们与购物车结合,这样系统可以抓取物品详细信息、数量和运输方式。

数据处理和利用的越多,机器算法就能得到更多的信息,使得聊天机器人想出精确的回复和提供详细的推荐。这就是为什么电子商务企业应当将他们的目光放在使用大数据顾客解决方案上,以获取全面、实时的数据资产图景和完善过的人机互动。

在高端搜索上掌握话语权

顾客通常带着想买什么的清晰目标进入一家网上商店。想象一下,他们会有多失望,如果搜出来的结果都是无关的。想要帮助客户买到合适的商品,提供给他们情景化、个性化的搜索工具至关重要。而这恰恰就是人工智能突出的地方。

例如,北面在运用人工智能系统上很成功,配备了语音输入和自然语言处理。他们的解决方案由IBM的Watson认知计算系统强化,可以帮助用户找到合适的夹克。

该系统分析了给定地区的客户的答案和天气情况,认真检查了350多种产品,然后找出了高度符合情景的商品。
相应地,eBay则认为一张图胜过千言万语。为了真正从搜索能力中获益,这家公司引进了两大创新特色–“在eBay上找”和“图像搜索”。

这些功能选择由计算机视觉和深度学习技术强化,使得用户可以买的整个互联网上的东西。消费者需要通过社交媒体分享某件商品的图片,提交一张相册里的照片,或在eBay 搜索框中输入一条URL网址,以获取与原始商品相匹配的完整产品列表。

为了使用户获得真正特别的搜索体验,eBay会处理该图像,扫描其11亿商品的目录,然后根据视觉相似性列出这些商品。

以销售智能获取收益

人工智能正通过帮助制作清晰的销售信息以触达更多的客户来进入市场线。

通过梳理大量的数据,人工智能使之前存放于网络空间的信息显现,包括购买之前、期间及之后的顾客行为,和他们的偏好、反馈、交易信息和人口信息。

获得的结果与快速小范围群组和模式相结合。这使得销售团队更好地瞄准客户,发现他们之间的相似性,了解谁最有可能买哪种商品。

除此之外,人工智能可以帮助市场者铲平道路。华盖创意公司(Getty Images, Inc.)使用图像识别和机器学习技术来分析竞争对手,追踪主要潮流,评估他们的网上商业影响,评估品牌的受欢迎度。

为了使整个过程更具影响力和在同一个地方储存所有信息,网上商店经营者可以要求销售公司将人工智能平台和公司的客户关系管理系统或企业资源计划软件结合起来。

从此以后,我们将走向何方?

本文中列出的例子表明人工智能正不断取得进展,以一系列方式帮助市场者。大数据解决方案、顾客形象识别软件和深度学习帮助个性化提案,培养顾客信任,提升销售额,扩大商业范围和限制。

显而易见,人工智能将在电子商务领域驻足相当长的时间。问题不在于企业是否相信这一技术,而是谁将首先采用人工智能驱动解决方案并在自己的营销策略中实施,使得对手望尘莫及。

  • 十一 10 / 2017
  • 0
Ideas

锐眼发现 | 《人类简史》作者尤瓦尔·赫拉利:无用阶级的人类将无法超越人工智能

作者:杨绚然

转载于:创业邦

11月6日,由京东金融与红杉资本联合主办的首届“JDD-2017京东金融全球数据探索者大会”正式在北京拉开大幕。《人类简史》作者、世界知名历史学家尤瓦尔·赫拉利发表了题为《AI——21世纪最伟大的革命》主题演讲。

尤瓦尔·赫拉利表示:现在科学正在开启一个全新的时代——人工智能时代。在人工智能时代,自然选择的法则将在生命的进化中没落,被智能设计所取代,权威从人类转移到了算法。

算法对人类的控制最初会体现在很普通的事情、很简单的决策上。

人工智能革命的另一个重要影响是它会彻底改变经济,尤其是就业市场,因为人工智能在越来越多的任务上表现的比人类更为出色。而作为无用阶级的人类在所有方面都无法超越人工智能。

以下为尤瓦尔·赫拉利所做的演讲速记:

如何评价AI在我们这个时代的意义?

我今天想和大家探讨的是21世纪最伟大的革命,它也可能不仅是人类历史上最伟大的革命,也是生命诞生以来最伟大的革命。四十亿年以来,所有生命都被自然选择的法则和有机生物化学的法则所控制着。不管你是一只恐龙还是一只变形虫、一个人类还是一个西红柿,你都要在自然选择的法则下进化,也都要有有机化合物构成。

现在科学正在开启一个全新的时代——人工智能时代。在人工智能时代,自然选择的法则将在生命的进化中没落,被智能设计所取代。生命将冲出有机生物化学统领的范围。在经过四十亿年的进化之后,我们将看到首个无机生命体的诞生。这次革命将在宇宙范围内带来极大影响。其中的一个影响就是,固守在地球四十亿年之后,生命将第一次能离开地球并开始在银河和宇宙中散播。但人工智能革命影响最迅速的不仅仅是银河系,还有我们的社会、经济和文化。

在接下来的几十年我们将要看到的,以及我们今天已经看见的,是权威的转移,从人类转向了算法。越来越多以往由人类独断的决策,那些我们做过的决策,未来都会由计算机和大数据算法做出。最基本的结论或者说这种转变的基础体现就是,一旦掌握了足够多的生物识别数据和足够的计算力,一个外部算法能够比我自己更好地理解我自己。一个拥有足够多的关于我的数据、也有足够算力的算法能理解我的欲望、情绪、想法、决策,能够在很大程度上控制我、操纵我。

算法将如何控制人类?这对人类意味着什么?

这种控制最初体现在很普通的事情、很简单的决策上,比如想要买什么书。

以往你要是想买一本书,你依靠的是自己的感觉,也可能依靠了解你、了解你品味的朋友和家人的推荐。但越来越多的,像买什么书、读什么书这类简单的决策将被电脑算法代我做出决定,比如亚马逊的算法。我们越是依赖了解我们、帮助我们做出决策的算法,我们就越会失去自主决策的能力。因为做出决定的能力是用进废退的。

如果你很长时间不用这项能力,它就像肌肉一样会萎缩。这种退化已经在我们的空间导航能力上体现了出来。以往你如果想从这里去火车站,你需要依靠自己的知识和经验。但是现在你越发依靠智能手机告诉你怎么走。很快你就会失去了找路的能力。

所以人工智能革命的重要影响之一就是权威会从人类身上转移到算法上。

除了权威从人类转移到算法,人工智能革命还会带来哪些变化?

人工智能革命的另一个重要影响是它会彻底改变经济,尤其是就业市场,因为人工智能在越来越多的任务上表现的比人类更为出色。随着人工智能在越来越多的领域超过人类,人类会面临更多的失业,并且我们可能会见证一个新的全球阶级的诞生——无用阶级,无用阶级的人类在所有方面都无法超越人工智能。

比如在无人驾驶领域,五到十年前,机器比人开车开得好听起来还像科幻小说。但今天大部分行业专家都认为这只是个时间问题,也许在未来10年、20年、30年,计算机和无人驾驶会取代上千万出租车司机、公交司机和卡车司机,让人类失业。人工智能驾驶相对人类驾驶员有着巨大的潜在优势。所以让人工智能司机替代人类司机是非常合理的。

同样地,用人工智能医生替代人类医生也是非常合理的。当然,随之而来的是,大多数人手中的经济、政治力量会转移到少数控制并拥有算法、计算机和网络的精英手中。

AI会如何影响金融行业?

同样的事情也会发生在金融领域。要做出明智高效的金融决策,速度非常重要,分析大量信息的能力也非常重要。人工智能处理信息的速度要比任何人类都快得多也高效得多。相比人类,人工智能处理金融决策时的另一个优势就是没有情感和身体。

人类在做价值数千万美元、人民币、欧元的金融交易时经常会犯很严重的错误,因为他们精力不集中,因为他们对某事在生气,或者情绪低落。但人工智能就不会犯这样的错误,它们没有身体,所以永远不会饿、疲惫、生气或者情绪低落。因为它们没有思维和情感,所以只会根据看到的数据做出决策,而不是根据瞬时的情绪。所以在未来几十年,很可能越来越的金融决策会由人工智能而非人类来做,而金融市场的竞争由人与人的竞争转变成算法之间的竞争。

事实上,随着这个过程的加速,我们有生之年也许会看到金融市场由人工智能操控的景象。事情发生如此之快,规模如此之大,人类可能再也无法理解金融市场。

五十年以后,也许没有人能够理解金融体系,只有人工智能才有能力处理这么多的数据,快速理解我们的金融世界。

这些过程的最终结果会是,我们可能会看到一个新的阶级兴起——无用阶级。就如同十九世纪的工业革命创造了一个新阶级——城市无产阶级,即工人阶级。也许二十一世纪最大的经济、社会、政治问题之一将是数亿无用的人该怎么办。这种无用当然不是从父母、朋友、孩子的角度来看,而是在经济和政治制度的角度是无用的。

无用阶级难道不能获得新的就业机会吗?

当然,新的就业机会很可能会出现,由于所有车辆驾驶、服装生产、甚至医药或金融领域的工作会消失,新的工作很可能会出现、被创造出来。但我们无法确定将创造出足够多的新工作。另外还有两个很大的障碍可能会使这些新工作无法解决无用阶级的问题。

首先,即使出现了新的工作,人们也将需具备非常高的技能才能胜任。

大多数专家认为流水线作业的工作,如衬衫生产或出租车驾驶将会被机器人或电脑接管。新的工作将要求人们善于创造,心灵手巧,灵活善变。大多数人都没有经过必要的教育和训练让他们能够执行这类工作。所以可能会有数百万的出租车司机和纺织厂工人失业,新的工作则可能是软件工程这类的工作。更糟糕的是人工智能革命将不会是孤立的分水岭事件。人工智能革命的浪潮将一浪高过一浪。

所以不管什么新的工作出现,在十年或者二十年之内,这些新工作本身也可能消失,被新版本、新一代的计算机和算法取代。想要拥有能做一辈子的工作或者专业,将变成过去时。这不是我们可以推迟到二十年、三十年之后再去面对的问题不像是说我们能自我安慰:人工智能革命要2040年或者2050年才会到来,我们等到那个时候再担心吧。

我们应该做些什么以免在人工智能时代被淘汰?

我们需要今天就考虑这个问题。因为今天的一大问题是在2017年的校园里我们要教小孩子什么、在2017年的学院或大学教学生们什么,才能让他们在2040年得到一份工作,习得必要的技能。如果等到2040年,那就太晚了。

到那个时候他们在学校学习的绝大部分东西就会和时代毫无关联。而在这里我们面对的一大问题就是我们不知道2040年、2050年的就业市场或者经济形势会是怎样的。没有人知道。

在历史上,人类第一次面对这样的窘境:没有人知道未来20年、30年、40年的世界是怎样的。所以我们不知道应该教孩子们学习什么。我能做的最好的预测就是教会他们思维灵活和心理平衡。唯一可以确信的是,2050年的世界将和现在完全不同,那将是一个非常繁忙的世界,以不断变化为其特征。

所以不论情况如何,人们都需要让自己心理平衡、思维灵活以应对这些变化。

上述情况是必然会出现的吗?

我想在收尾前说的最后一点就是技术从不是决定性的,以往也不是。技术总是在我们面前打开无数广阔前景的可能性,但却不会决定我们选择实现哪种可能性。人工智能必然会完全改变我们的生活、我们的社会、我们的经济和政治体系。

但会怎样改变呢?

可以有很多不同的方式,但我们仍然有一些标准可以去选择用这些新技术去做什么。如果我在这里概述的某些可能性让你感到恐惧,那在这场人工智能革命中你仍可以做点什么。

谢谢大家!

随时欢迎您 联系我们