:::: MENU ::::

TalkingData's Blog

现在开始,用数据说话。

大数据的“无所不能”与“无能为力”

cialis erfaring cialis i norge hva er kamagra cialis efeitos secundarios cialis bula viagra effekt viagra norge viagra på nett viagra nettbutikk viagra infarmed levitra comprimidos cialis uten resept cialis pris levitra eller cialis kamagra gel comprar viagra farmacia
  • Apr 28 / 2018
  • 0
Data

大数据的“无所不能”与“无能为力”

作者:TalkingData 于兰

本文由TalkingData原创,转载请获取授权。

偶尔与身处传统行业的朋友聊到大数据,朋友说,对大数据怀有一种“敬畏”的心理,认为它很神奇,神奇到似乎可以点石成金无所不能。但身处这个行业,在敬畏它的同时,却不时会被一种深深的无奈所包裹,切实感觉到在梦想面前,大数据也有太多的无能为力。所以今天,我们来聊一聊大数据的”无所不能“与”无能为力“

大数据的“无所不能”

无论是传统工业时代,还是大数据时代,信息是决策的基础:更优的决策,需要更多、更及时的信息——大数据的价值核心,是“消除信息不对称”,即提升人或程序对事物的认知。

因此,大数据可以做很多事情:

  • 在市场营销中,大数据可以帮助市场人员了解客户群体的特征、偏好和购买倾向——只将广告投给需要的人,可以节约被浪费的广告费,却不降低广告的效果;
  • 在金融风控中,大数据可以帮助业务人员了解顾客群体的收入水平、资产情况、借贷历史、违约风险——不向高风险顾客发放贷款,或事先对可疑人员进行核查、采取措施,可以有效降低坏账率,提升资产质量;
  • 在零售经营中,大数据可以帮助领导层了解各商圈的人流量情况、人群特征、周边环境、竞品策略等(是比现场调研更全面、更高效且成本更低的市场分析方案)——选择人流量、人群消费水平更符合本企业定位,且竞品并没有深入挖掘的地点开设新店,意味着在起步阶段就跑在了前面;
  • 在物流运输中,大数据可以帮助经营人员了解各地需求、线路业务量、节点负荷和处理效率——线路规划、节点布局及资源配置、关键节点优化,都可以有效的提升物流效率。

除了以上为企业带来切实利益的大数据应用,伴随着机器学习、人工智能的发展,大数据也为我们展开了更宏伟的蓝图:

  • 语音识别和文本挖掘,使得人与机器的自然交互突飞猛进,各种智能交互机器人层出不穷;
  • 图像识别和处理技术,结合线路规划、智能决策等大数据应用,让无人驾驶站在了时代的风口上;
  • 对各种疾病发展过程、影响因素的分析,及人体状态的监测、感应,形成了健康监护和智慧医疗的前提;
  • ……

一言概之,大数据为“信息获取”开辟了无数的通道,引领我们一路高歌猛进,依靠大数据,我们对周围的世界、对自身、对事物之间的关系都有了更深入的认知,也有了以前想都不敢想的各种处理方案,让我们“无所不能”。

但理想总是“丰满”,现实却是“骨感”,看上去“无所不能”的大数据,本身就带着诸多的“无能为力”。

大数据的“无能为力”

数据质量

伴随“多”的是“无序”,伴随“更多的信息”而来的,可能是“信息冗余”。数据质量,是数据应用之初与生俱来的问题。

要判断移动设备的常驻城市,可能从数据源A得到的是北京,从数据源B得到的天津,而我们压根儿没有明确的标准,来判断数据源A和B到底哪个正确,因为,正是因为不知道才需要寻求外部数据源帮助!

也许你会说,找已知样本测试就可以了。但事实上,很多数据且不说能不能找得到样本,即便能找得到,用作标准的样本本身有多大可信性,也是一个需要验证的问题。

隐私与安全

伴随着大数据的应用,越来越多的数据被“滥用”,隐私被泄漏的问题被曝光。数据应用的程度越高,经过的验证和磨砺越多,准确性越高,所受的监管也就越强,使用过程中所受限制就越多。

对于数据应用方来说,面临的可能是不断的寻找数据源、验证数据有效性、接受监管并调整、寻找新的数据源的过程。

站在数据应用方角度,面临客户隐私与数据安全,会时不时的有深深的“无力感”;但站在整个社会责任的角度,数据隐私与安全则是必须要守住的底线。

边界与壁垒

我们数据应用中的很多设想,都建立在各方数据可无缝打通和关联的基础上,但实际数据应用中,因为数据产生于不同的企业主体、有不同的处理流程和架构,“关联”并不是“无缝”的。

  • 千辛万苦找到了适合的数据源,可能因为双方ID无法打通,导致数据根本无法使用;
  • 战略合作训练了效果很好的模型,可能因为双方数据都无法出各自机房而无法实际投产,寻找绕行路线却又大大牺牲了效果;
  • 数据与场景的结合,可能因为合作双方理解差异导致数据的误用……

如何减少大数据的“无能为力”

首先,建立数据流通标准。“标准”可以在很大程度上解决“质量”的问题,也可以让供需双方更好的对话,降低数据流通的成本;

其次,划定数据安全基线。有“基线”,就有了“基线”范围内的自由和法律保护,将“隐私与安全”作为每一个市场玩家的底线,就不会在安全加码时束手无措倍受打击;

再次,构建数据流通平台。“平台”可以有效承载数据流通的标准,同时更好的打破供需双方的边界壁垒,实现供需有效结合。

TalkingData智能数据服务商城,致力于为数据供应方和数据需求方提供平台,实现数据流通过程中的标准化交付、质量评估、实时计量等公共能力,降低数据交易流通成本。

让理解照进现实,实现大数据的“无所不能”,我们一直在努力。

 

Leave a comment

随时欢迎您 联系我们