锐眼洞察 | 学了这么久机器学习,你真的了解它的概念吗?

作者:TalkingData 杨慧

本文为TalkingData原创,未经授权禁止转载。申请授权请在评论中留言联系!

导语:

本文是对 TalkingData腾云大学执行校长杨慧分享的两个专题的总结,分别介绍了国内外知名学者、媒体对 Machine Learning 和 Business Intelligence 的定义,也谈了杨慧个人的理解。

 

什么是机器学习?

导读:

学习一直是生物具有的特性,在人类身上的表现尤为明显。机器学习,顾名思义,就是让机器(计算机、程序)也具备学习的能力。更精简点来说,就是通过经验提高性能的某类程序。

卡内基梅隆大学(Carnegie Mellon University)的 Tom Michael Mitchell 教授在 1997 年出版的书籍 Machine Learning 中对机器学习进行过很专业的定义,这个定义在学术界内被多次引用。

在这本书中对机器学习的定义为:

假设一个程序能够在任务 T 上,随着经验 E 的添加,效果 P 也能够随之添加,则称这个程序能够从经验中学习。

在大部分情况下,在训练数据达到一定数量之前,越多的训练数据能够使逻辑回归算法的推断越精准。但是如果数据的特征值,也就是描述一条数据的维度越少,那么即使有再多的训练数据,逻辑回归算法也无法非常好地利用。

因此,机器学习的效果与数据的维度密不可分。怎样数字化地表达现实世界中的实体,一直是计算机科学中一个很重要问题,维度越多,描述得越清楚,机器学到的经验越多。

因此,工欲善其事必先利其器,机器学习这种手段不是大数据的价值所在,更广泛的数据维度,占有更多有多维度价值的数据集,才是大数据的价值所在。

 

 

机器学习(ML)是探索学习算法的构建和研究(DAMA DMBOK)。

此外,“机器学习建立具有适应性参数的程序,参数可根据程序收到的数据自动调整。通过适应已经看到的数据,程序能够改善他们的行为。另外程序还对数据进行了概括,这意味着这些程序可以在以前不可见的数据集上执行功能。”(Alejandro Correa Bahnsen)

据 Keith D. Foote 介绍:最基本的机器学习就是使用算法来解析数据,从中学习,然后对世界上的事物做出决定或预测的实践。因此,机器学习使用大量的数据和算法对机器进行“训练”,赋予其学习如何执行任务的能力,而不是用一些特定的指令手工编写软件程序来完成特定的任务。

机器学习同以下概念相结合(DMBOK):

  • 监督学习:基于广义规则;例如,将垃圾邮件从非垃圾邮件中分离出来。

  • 无监督学习:基于识别隐藏模式(即数据挖掘)。

  • 强化学习:基于实现目标(例如,在象棋中击败对手)。

  • 机器学习还包括编程机器,来快速从查询中学习,并适应不断变化的数据集。

机器学习的其他定义还包括:

先进的算法“由许多技术组成(如深度学习、神经网络和自然语言处理,以现有信息的经验为指导)”(Gartner IT 术语表)

“基于数据经验的结果而更新知识库的系统。”(Adrian Bowles)

“数据分析的一种方法,可自动建立分析模型。”(SAS)

内置智能的算法,使用可用的数据来回答问题。(Paramita Ghosh)

“通过解读我们周围的世界的数据,分类以及从成功和失败中学习这些方法,教计算机和我们同样的学习方式。”(Forbes)

人工智能的一个子领域,或是机器使用数据和自学的 AI 领域。(TechRepublic)

用于数字化转换的人工智能。(哈佛商业评论)

企业使用机器学习来:

  • “大幅缩短回答时间,指导组织洞见”(DMBOK)

  • 处理计算机系统的威胁或安全问题

  • 预测或执行预测分析(McKinsey)

  • 赶上数据量的增长(ComputerWorld)

  • 开发 AI 算法中复杂问题自动化(MIT Technology Review)

  • 在提高员工敬业度和提高客户满意度的同时扩大一线增长(Harvard Business Review)

  • 提高编程的效率和速度(James Kobielus)

  • 在多个行业中提升和开发众多不同的用例 (Paramita Ghosh)

什么是商业智能?

导读:

BI 有两层含义:一层是工具类含义-做分析的技术集;一层是职能类含义,做分析的过程。这两者缺一不可。

如果只看到了 BI 的工具类含义,就会误入“工具至上”之路。BI 说到底还是为了业务服务,只有解决了业务痛点问题的 BI 才是 Smart BI。从业务角度来说,BI 解决的问题包括了:决策的正确性(effectiveness)和决策的即时性(efficiency)。

 

 

商业智能(BI)包含了分析、报告不同业务操作的技术和工具。商业智能使用存储在不同数据仓库、数据集市、数据湖泊和其他存储平台中的原始数据,将其转换为可操作的知识/信息资产。内容包括仪表盘,电子表格,数据可视化,报告等等。

“在其更为详尽的用法中,BI 是在指定组织内收集、存储、回收和分析数据资产所必需的所有系统、平台、软件、工艺和技术。因此,BI 是用于战略规划、决策制定、市场调研、客户支持、库存分析、统计报告以及企业在整体运营洞察机制等其他方面的程序和流程。”(Kelle O’Neal&Charles Roe)

如 DAMA DMBOK 所述:

“商业智能有两个含义:首先是指一种旨在了解组织活动和机会的数据分析。这类分析结果用来提高组织的成功;其次,商业智能是支持这种数据分析的一系列技术。商业智能工具可以实现查询、数据挖掘、统计分析、报告、场景建模、数据可视化和仪表盘。 ”

商业智能的其他定义包括:

“包含应用程序,基础架构,工具和最佳实践的一个统称,可以访问和分析信息以改进和优化。”(Gartner IT 词汇表)

 

“BI 的重点在于:在正确的时间基于正确的信息快速高效地做出决策。”(Keith Foote)

软件和服务的杠杆作用,将数据转化为可行的运筹情报、以及组织的战略战术业务决策。(Mary Pratt,CIO)

一个“总括术语,涵盖了围绕商业数据收集,处理和分析的一系列活动。”(美国东北大学 Mikal Khoso)

“一套利用信息管理流程输出进行分析、报告、绩效管理和信息交付的方法,流程,架构和技术。”(Forrester)

“这个术语是指将原始数据转化为企业可以用来做出更好的组织决策的信息的想法、实践和技术。”(BusinessIntelligence)

组织/公司使用商业智能来:

  • 支持操作功能

  • 执行监管要求

  • 获得关于公司、客户和产品的洞见

  • 获得竞争优势

  • 实践描述性,预测性,规定性和实时分析

  • 做出决策或监控进度(Kelle O’Neal)

 

发表评论

电子邮件地址不会被公开。 必填项已用*标注