去年12月,阿里宣布在集团管理层面设立首席数据官(Chief Data Officer)岗位,负责全面推进阿里巴巴集团成为“数据分享平台”的战略。今年初,阿里集团一系列架构调整,成立了数据委员会,由淘宝网商业智能部负责人车品觉出任首任会长。
第一财经日报:阿里集团业务庞大,大数据架构处于一级战略部门。但是,阿里数据委员会是一个虚拟的组织,虚拟如何管理实体?
车品觉:阿里数据委员会主要职责是协同不同数据部门的工作,每个公司的数据都分散到不同组织,需要制定整个集团数据应用的方向和规则,协同各个部门使用数据,这看起来是虚的;但数据委员会的成员是各个数据部门的领导,他们能够推动实际执行。
日报:在类似双十一等重要节日,大数据部门如何影响具体决策?
车品觉:首先,每年双十一通常有一个既定目标,大数据部门通过对比历史数据(即往年双十一的数据),判断这一目标是否靠谱,是否需要调整;如果目标靠谱,再通过数据分析如何达到目标,应该从哪个方面努力。
但在实际操作过程中,往往伴随预警或临时调整;有时,需要开创新的领域,没有历史数据可以比较,则是商业运营的人根据敏感性直接制定目标,数据部门配合完成。
日报:你如何看待数据的内部共享及对外开放?目前,阿里集团的数据对外开放到哪种程度?
车品觉:相对而言,阿里数据相对集中,大部分数据都集中在一个平台,内部共享不是难题。在对外开放方面,阿里持保守观点,不容许开放到第三方商用;对于平台商户等合作伙伴,开放的一定不是原始数据,而是像石油一样经过提炼,绝不涉及个人隐私。
日报:目前各种数据繁复,在实际采集及数据筛选过程中,如何保障数据质量?
车品觉:数据诞生过程好像炼制石油,保证数据质量,首先要了解数据产出的源头,并能随时追踪溯源;即如果源头有更改,能够让使用者及时知晓。
日报:阿里在数据获取、应用等方面,如何把握尺度,在用户可接受的范围内提供更好的服务?你个人认为,这一界限在哪里?
车品觉:其实,很多用户不在意数据被采集,但是很关注数据应用。以美国为例,虽然在数据采集上比较开放,但在个人应用方面比较严苛,可谓零容忍;从应用来讲,要应用这个数据要进行PRD的原则,经过内部的评审,看有没有侵犯到个人隐私,这是从内部来讲对个人隐私方面还是相对保护得比较多。
日报:你个人认为数据化运营最大的难题在哪里?
车品觉:数据化运营最大的难题在于数据产业链条没有打通。这个链条包括商业运营、做(基础)数据、(构建)数据模型等环节。
具体而言,做数据的人不知道别人怎么用,用数据的人不知道数据怎么来的;而做数据模型不知道数据是否稳定;用数据模型的人不知道数据模型究竟是怎样的,甚至不相信数据模型。
上述几者的信息不对称,造成对数据化运营的不理解;但经历这种理解后,未来能够过渡到运营数据阶段,会有更好的数据应用。
日报:关于大数据的盈利模式,具体看得见的有哪些模式?
车品觉:今天很多大数据公司还在投资,不能称得上盈利。盈利点到底是在哪里,最简单的是用数据去做一些数据产品,好像以前的数据魔方,或者今天的阿里金融,也是用数据生产一套新东西出来,我相信这是今天比较容易能看见的。