01 价值
随着大数据的发展,各行各业都面临越来越庞大且复杂的数据,这些数据如果不能有效管理起来,不但不能成为企业的资产,反而可能成为拖累企业的“包袱”。数据治理是有效管理企业数据的重要举措,是实现数字化转型的必经之路,对提升企业业务运营效率和创新企业商业模式具有重要意义。
1.1 降低业务运营成本
有效的数据治理能够降低企业IT和业务运营成本。一致性的数据环境让系统应用集成、数据清理变得更加自动化,减少过程中的人工成本;标准化的数据定义让业务部门之间的沟通保持顺畅,降低由于数据不标准、定义不明确引发的各种沟通成本。
1.2 提升业务处理效率
有效的数据治理可以提高企业的运营效率。高质量的数据环境和高效的数据服务让企业员工可以方便、及时地查询到所需的数据,然后即可展开自己的工作,而无须在部门与部门之间进行协调、汇报等,从而有效提高工作效率。
1.3 改善数据质量
有效的数据治理对企业数据质量的提升是不言而喻的,数据质量的提升本就是数据治理的核心目的之一。高质量的数据有利于提升应用集成的效率和质量,提高数据分析的可信度,改善的数据质量意味着改善的产品和服务质量。数据质量直接影响品牌声誉。
1.4 控制数据风险
有效的数据治理有利于建立基于知识图谱的数据分析服务,例如360°客户画像、全息数据地图、企业关系图谱等,帮助企业实现供应链、投融资的风险控制。良好的数据可以帮助企业更好地管理公共领域的风险,如食品的来源风险、食品成分、制作方式等。企业拥有可靠的数据就意味着拥有了更好的风险控制和应对能力。
1.5 增强数据安全
有效的数据治理可以更好地保证数据的安全防护、敏感数据保护和数据的合规使用。通过数据梳理识别敏感数据,再通过实施相应的数据安全处理技术,例如数据加密/解密、数据脱敏/脱密、数据安全传输、数据访问控制、数据分级授权等手段,实现数据的安全防护和使用合规。
1.6 赋能管理决策
有效的数据治理有利于提升数据分析和预测的准确性,从而改善决策水平。良好的决策是基于经验和事实的,不可靠的数据就意味着不可靠的决策。通过数据治理对企业数据收集、融合、清洗、处理等过程进行管理和控制,持续输出高质量数据,从而制定出更好的决策和提供一流的客户体验,所有这些都将有助于企业的业务发展和管理创新。
02 现状
对企业而言,不同的行业、不同的业务特点、不同的信息化水平,决定了企业数据治理目标和数据管理的现状存在差异,不可一概而论。
由于经济实力不同,行业特点不同,信息化程度不同,不同行业、不同企业的数据管理和数据治理情况也不尽相同,有的行业甚至才刚刚起步。不过,各行业的企业信息化的总体发展趋势基本都遵循了诺兰模型。
美国管理信息系统专家理查德·诺兰通过总结200多家企业发展信息系统的实践和经验,提出了著名的信息系统进化的阶段模型,即诺兰模型。诺兰模型分析了信息化发展的一般规律,对于我们认识数据治理的必要性有深刻的意义。
诺兰认为,任何组织在从手工信息系统向以计算机为基础的信息系统发展的过程中,都存在着一定的客观发展道路和规律。他将这个规律分为6个阶段:起步阶段、扩展阶段、控制阶段、集成阶段、数据管理阶段和成熟阶段(见图1)。
▲图1 诺兰模型给我们的启示
1)起步阶段
初期引入的计算机主要起宣传、启蒙的作用,不要求有实际的效益。在这一阶段,IT需求只被当成改善办公设施的简单需求来对待,采购量少,只有少数人使用,在企业内没有普及。
2)扩展阶段
在这一阶段,计算机开始普及,企业对计算机有了一定了解,想利用计算机解决工作中的问题,比如进行更多的数据处理,为管理工作和业务带来便利。企业对IT应用开始产生兴趣,出现了盲目购机、盲目定制开发软件的现象,但由于缺少计划和规划,因而应用水平不高,IT的整体效用无法凸现,这也标志着社会正在向信息化时代迈进。
3)控制阶段
投入使用的应用系统多了,计算机在企业经营过程中开始发挥作用。在这一阶段,一些职能部门内部实现了网络化和电子化,如财务系统、人事系统、库存系统等,但各软件系统之间还存在“部门壁垒”和“信息孤岛”。信息系统呈现单点、分散的特点,系统和数据资源利用率不高。企业对于数据的重要性及数据管理的认知处于萌芽阶段。
4)集成阶段
企业开始重新进行规划设计,建立统一的信息管理系统,企业的IT建设开始由分散和单点发展到成体系。ERP系统、SOA体系开始流行,企业将不同的IT系统统一到一个系统中进行管理,使人、财、物等资源信息能够在企业中集成共享。在这一阶段,数据资源的集成共享成为企业数据管理的核心诉求,信息化发展较快的企业开始建设数据仓库、数据分析等系统,开始探索数据背后的价值。
5)数据管理阶段
企业高层意识到数据战略的重要性,数据成为企业的重要资源,企业的信息化建设真正进入数据处理阶段。在这一阶段,企业的业务和管理决策开始以数据为重要依据,企业的数据管理从关注数据整合到关注数据质量和安全,社会进入以数据治理为基础的数字化时代。
6)成熟阶段
信息系统已经可以满足企业各个层次的需求,从简单的事务处理到支持高效管理的决策,IT的作用被充分发挥出来。在这一阶段,数据在企业管理决策、业务创新中不仅起着支撑和参考的作用,而且还是驱动要素。数据不仅被作为企业的重要生产资料,用来提升企业竞争力,甚至还可以重塑企业的商业模式。到了这一阶段,企业的数据治理不再被视为信息化的支撑体系,而是企业的一项常规业务,就如同企业的生产、营销、服务等业务一样。
诺兰模型在信息化建设发展中具有十分重要的指导意义。目前国内有少部分企业进入第四阶段晚期或第五阶段早期,中小企业有1%~2%进入第四阶段,约40%进入第三阶段,大多数中小企业还处在第一或第二阶段。诺兰模型说明,数据资源整合是信息化建设的必经途径,是数据资源充分利用的基础。
国内各行业的企业数据治理发展情况并不均衡,企业数据治理现状可以大致分为以下3类。
第一类,企业拥有雄厚的经济实力,信息化起步较早,企业的业务对信息化和数据的依赖程度较高。例如,BAT等互联网企业、金融业的各大银行、三大电信公司、国家电网等企业,该类企业大约在10年前就开始实施数据治理,目前已形成较为完善的数据治理体系。
第二类,企业有一定的经济实力,建设的信息系统较多,在单业务条线上信息化的应用程度较高。这类企业数据治理的普遍现状是:早期的信息化缺乏整体规划,建设了多个信息系统,沉淀了大量的数据,但缺乏统一的数据标准,系统之间的数据没有打通,形成了一个个“信息孤岛”。该类企业对数据价值的认识度很高,迫切希望通过发挥数据的价值,驱动企业管理和经营模式的创新。它们开始对数据进行大规模的整合,并基于此进行一些数据治理和应用方面的探索。目前国内的大型生产制造企业普遍存在“信息孤岛”的问题。
第三类,企业的经济实力相对薄弱,信息化刚刚起步,部分企业使用了财务软件、OA系统、ERP系统,数据存放在部门的系统中,甚至有些数据存放在个人电脑中,数据的共享程度较低。该类企业的战略目标是以生存为主,更关注业务和财务,在信息化上的投入较少。我国的中小企业多数属于这一类。当然,其中不乏意识超前的企业家和领导者,他们将数据视为重要的生产资料,希望通过数据的利用实现企业质的飞跃。
目前多数企业已经意识到企业要转型,要发展,就必须紧跟时代的步伐,而数据治理是企业实现数字化转型的必经之路。然而让很多企业感到困惑的是,如何选择企业数据治理的时机?是先有了数据再治理,还是先建设好数据治理体系再进行应用系统建设?不同类型企业的数据治理策略绝对不能一概而论,而应根据企业的阶段特点来制定。
对于第一类企业,企业已经有了相对完善的数据治理体系,需要注重加强数据应用,加快数据驱动的创新步伐,稳固提升数据质量和数据变现能力。
对于第二类企业,企业的信息系统多,“信息孤岛”问题严重,数据不能互联互通,不能按照用户的指令进行有意义的交流,数据的价值不能充分发挥,其数据治理已迫在眉睫。这类企业应加强数据资源的整合和治理,充分释放数据的价值。
对于第三类企业,在数字化浪潮下,企业的信息化虽然薄弱,但如果打好数据基础,未必不是企业改革创新、实现“弯道超车”的最佳时机。
虽然目前我国多数企业仍处于中期的数据集成阶段,但是在云计算、大数据等新技术的推动下,很多企业开始迈开步伐,已走进以数据管理为标志的数字化时代。
03 问题
伴随着大数据时代的来临,人们对数据的重视达到了前所未有的高度。
全球知名咨询公司麦肯锡称:“数据已经渗透到当今每一个行业和业务职能领域,成为重要的生产要素。人们对于海量数据的挖掘和运用预示着新一波生产率增长和消费者盈余浪潮的到来。”
世界经济论坛报告认为:“大数据为新财富,价值堪比石油。”
维克托·迈尔-舍恩伯格在《大数据时代》一书中提到:“虽然数据还没有被列入企业的资产负债表,但这只是一个时间问题。”
“数据是企业的重要资产”已经成为各行各业的共识,但是拥有了数据就等于拥有了数据资产吗?事实上,并非如此。
企业数据的管理和使用还存在很多问题,致使数据不能很好地利用起来,从而让企业的数据没能成为数据资产,反而变成了拖累企业的包袱。
企业数据管理的问题主要有以下5类,如图2所示。
▲图2 企业数据管理的5类问题
3.1 黑暗数据
黑暗数据也叫睡眠数据,是指被收集和处理但又不用于任何用途的数据。有数据而不用,甚至业务部门和领导都不知道其存在,这些数据可能永远被埋没。很多企业其实除了黑暗数据问题,还有数据尾气问题。数据尾气是指那些针对单一目标而收集的数据,通常用过之后就被归档闲置,其真正价值未能被充分挖掘。
之所以会产生黑暗数据和数据尾气,主要是因为企业内很多系统的设计对于业务人员不够友好,操作功能复杂,可视化效果差,甚至系统采集的数据指标与业务需求脱节,并不能为业务分析提供有效的数据,或者不能及时提供数据,这就不可能驱动业务人员使用数据。部分IT人员虽然知道有哪些数据,但是由于缺乏业务需求的驱动,也不去用或不会用。
据统计,企业的数据中有50%~80%可能是睡眠数据,始终无人知晓。
数据是具备复用性的资源,我们不应用完即舍弃,它的再利用价值也许你现在不清楚,但在未来的某一刻,它会迸发出来,变“废”为宝。
3.2 数据孤岛
很多企业在信息化建设的早期,由于缺乏信息化的整体规划,业务系统都是基于业务部门需求建设的,各业务部门都有自己的信息系统,这些系统都是各自定义、各自存储的,彼此间相互独立,数据之间没有关联,而形成了一个个数据孤岛。所谓数据孤岛,简单来说,就是企业发展到一定阶段时,各个部门各自存储数据,部门之间的数据无法共通,这导致数据像一个个孤岛一样缺乏关联性。
企业想利用好数据,就必须打通数据孤岛。然而打通数据孤岛是一项复杂的工程,其困难不仅在于技术,还来自业务。数据本身是因业务和流程而产生的,只有对企业业务和流程进行细致梳理和深度理解,才能真正实现数据的打通。由于打通数据孤岛的成本高,难度大,周期长,众多企业望而却步。
3.3 数据“巴别塔”
巴别塔是《圣经》中的一个故事。这个故事有很多隐喻,其中一个是在协作的过程中顺畅沟通的重要性。顺畅沟通的前提是彼此之间有一套共同认可的对话标准。
在很多企业中存在着数据“巴别塔”。不同部门、不同员工之间因为数据定义不清、口径不同、缺乏规范而无法顺畅交流和沟通。例如:某个大型集团对于“在职员工”指标的定义五花八门,有的部门是按照是否与企业签订劳务合同来统计的,有的部门是按照企业发放工资的人数来统计的,还有的部门是按照在本单位的人数进行统计的,等等。不同部门对“在职员工”的定义和统计口径都不一样,这种情况下,谁也不知道集团到底有多少员工。
3.4 糟糕的数据质量
数据对企业来说是一个“福音”,然而,糟糕的数据质量可能是一个大问题。数据的可信性是影响数据分析和管理决策的重要因素,然而企业数据普遍存在着不一致、不完整、不准确、不正确、不及时等问题。数据质量问题得不到有效解决,数据价值化、数据业务化就无从谈起了。
如果说数据是“石油”,那么原始数据也只能算“原油”,其本身没有太大的价值。原油只有经过加热、催化、蒸馏、分馏等一系列淬炼、提纯的过程,才能产出不同型号、规格的产品。数据其实也一样。原始数据并没有什么作用,只有经过采集、存储、处理、清洗等一系列加工处理过程,才能形成可信的、高质量的、可被利用的数据资产。
3.5 数据的安全风险
数据的应用与数据的安全密切相关。数据收集和提取的合法性、数据隐私的保护与数据隐私应用之间的权衡正成为当前制约大数据发展和应用的一大瓶颈。没有人不重视数据安全,但是数据缺乏有效管理,一定会产生数据安全问题。比如缺少数据的采集、存储、访问和传输的规范制度,没有设定必要的数据使用权限,这就必然会导致数据遗失、篡改与泄密。
可见,只有管得住、用得好,数据才是企业的资产,否则就会成为拖累企业的包袱。
04 挑战
企业越大,需要的数据和产生的数据也就越多,而数据越多则意味着就越需要定制适合企业自身的正式且有效的数据质量策略。在向着数字化快速迈进的同时,当前企业数据治理面临着各种挑战,主要表现为以下6个方面。
4.1 对数据治理的业务价值认识不足
“数据为什么重要?”“数据治理到底能解决什么问题?”“数据治理能实现哪些价值?”这是数据治理经常被企业领导和业务部门质疑的三大问题。传统数据治理是以技术为导向的,注重底层数据的标准化和操作过程的规范化。尽管以技术驱动的数据治理能够显示数据的缺陷,提升数据的质量,但是管理层和业务人员似乎对此并不满足。
由于传统以技术驱动的数据治理模式没有从解决业务的实际问题出发,企业对数据治理的业务价值普遍认识不足。为了快速实现数据价值和成效,最直接的方式就是以业务价值为导向,从企业实际面临的数据应用需求和数据痛点需求出发,满足管理层和业务人员的数据需求,以实现数据的业务价值、解决具体的数据痛点和难点为驱动来推动治理工作。
企业数据治理的业务价值主要体现在降低成本、提升效率、提高质量、控制风险、增强安全和赋能决策。不同企业所面对的业务需求、数据问题是不同的,企业数据治理的业务价值不要求在以上6个方面面面俱到(也不要局限于这6个方面)。企业应该从管理层和业务部门的痛点需求出发,将数据治理的业务价值量化,以增强管理层和业务人员对数据治理的认知和信心。想要理解数据造成的业务痛点,最好的方法是询问和观察。数据治理必须着重于业务需求,并着重于解决让业务人员感到痛苦或他们无法解决的问题。
4.2 缺乏企业级数据治理的顶层设计
当前企业普遍都认识到了数据的重要性,很多企业也开始了探索数据治理。然而我们看到,目前企业大量的数据治理活动都是项目级、部门级的,缺乏企业级数据治理的顶层设计以及数据治理工作和资源的统筹协调。
数据治理涉及业务的梳理、标准的制定、业务流程的优化、数据的监控、数据的集成和融合等工作,复杂度高,探索性强,如果缺乏顶层设计的指导,那么在治理过程中出现偏离或失误的概率较大,而一旦出现偏离或失误又不能及时纠正,其不良影响将难以估计。
数据治理的顶层设计属于战略层面的策略,它关注全局性和体系性。在全局性方面,站在全局视角进行设计,突破单一项目型治理的局限,促进企业主价值链的各业务环节的协同,自上而下统筹规划,以点带面实施推进。在体系性方面,从组织部门、岗位设置(用户权限)、流程优化、管理方法、技术工具等入手,构建企业数据治理的组织体系、管理体系和技术体系。
企业数据治理的顶层设计应站在企业战略的高度,以全局视角对所涉及的各方面、各层次、各要素进行统筹考虑,协调各种资源和关系,确定数据治理目标,并为其制定正确的策略和路径。顶层设计主要是抓牵一发而动全身的关键问题,抓长期以来导致各种矛盾的核心问题,抓严重影响企业信息化健康稳定发展的重大问题。唯有如此,才能纲举目张,为解决其他问题铺平道路。
4.3 高层领导对数据治理不够重视
数据治理是企业战略层的策略,而企业高层领导是战略制定的直接参与者,也是战略落实的执行者。数据治理的成功实施不是一个人或一个部门就能完成的,需要企业各级领导、各业务部门核心人员、信息技术骨干的共同关注和通力合作,其中高层领导无疑是数据治理项目实施的核心干系人。
企业高层领导对数据治理的支持不仅在于财务资金方面(当然这必不可少),其对数据战略的细化和实施充分授权、所能提供的资源是决定数据治理成败的关键因素。
为了保证数据治理的成功实施,企业一般需要成立专门的组织机构,例如数据治理委员会。尽管很多企业的数据治理委员会是一个虚拟组织,但是必须为这个组织安排一名德高望重的高管,我们姑且将这个岗位命名为“首席数据官”(CDO)。数据治理委员会由CDO、关键业务人员、财务负责人、数据科学家、数据分析师、IT技术人员等角色组成,负责制定企业数据治理目标、方法及一致的沟通策略和计划。
在数据治理项目的实施过程中,CDO不仅需要负责统筹数据定义、数据标准、治理策略、过程控制、体系结构、工具和技术等数据治理工作,还需要关注如何为业务增加价值以及是否获得关键业务负责人的支持。CDO经常关注数据的业务价值,并利用数据科学家、分析师和管理人员的更多技能,向CEO报告以获得持续的资金、政策和资源支持。
4.4 数据标准不统一,数据整合困难
第一,企业内部的数据标准不统一。我国各行业的企业信息化水平不均衡,数据缺乏行业层面的标准和规范定义。在信息化早期,信息系统的建设是由业务部门驱动的,由于缺乏统一的规划,形成了一个个信息孤岛。而随着大数据的发展,企业数据呈现出多样化、多源化的发展趋势,企业必须将不同来源、不同形式的数据集成与整合到一起,才能合理有效地利用数据,充分发挥出数据的价值。然而由于缺乏统一的数据标准定义,数据集成、融合困难重重。
第二,企业之间的数据标准不统一。各行业、各企业之间都倾向于依照自己的标准采集、存储和处理数据,这虽然在一定程度上起到了保护商业秘密的作用,但阻碍了企业(尤其是位于同一产业链上的上下游企业)之间的协同发展,不利于企业“走出去”加强企业间的交流和合作。
4.5 业务人员普遍认为数据治理是IT部门的事
在很多企业中,业务人员普遍认为数据治理是IT部门的事,而他们自己只是数据的用户,因而对数据治理是“事不关己,高高挂起”的态度。这个认识是错误的,IT部门的确对数据负有很大责任,但不包括数据的定义、输入和使用。数据的定义、业务规则、数据输入及控制、数据的使用都是业务人员的职责,而这些恰恰是数据治理的关键。
大多数业务部门对IT部门的感情是复杂而矛盾的:一方面感觉到IT越来越重要,业务的发展离不开IT部门的支持;而另一方面却对IT部门不是很了解,对IT的价值还心存疑虑。
数据质量问题到底应该由谁来负责?这也是IT部门和业务部门经常互相推诿的问题。难道IT和业务真的是两个不可调和的矛盾体吗?事实并非如此。离开业务的IT并不会产生价值,而离开IT的业务会失去数字化时代的竞争力。
因此,在数字化时代,IT和业务更应当紧密融合在一起,朝着共同的目标努力。有效的数据治理策略是实现数据驱动业务、业务融入IT的重要举措,这些举措包括数据治理的规划应与业务需求相匹配,数据治理的目标应围绕业务目标的实现而展开。建立数据治理委员会,将业务人员与IT人员融入同一个组织,让他们为了一致的目标而努力,荣辱与共。让业务人员与IT人员一起定义数据标准、规范数据质量及合理使用数据。
在企业数字化转型过程中,IT即业务,IT即管理,业务人员的目标是“在正确的时间、正确的地点获得正确的数据,以达到服务客户、做出决策、制定计划的目的”,而IT人员的目标则是“在正确的时间、正确的地点将正确的数据送达业务人员”,成为业务部门的可靠供应者。
4.6 缺乏数据治理组织和专业的人才
数据治理实施的一个重要步骤是建立数据治理的组织并选拔合适的人才,这看起来容易,但真正执行起来却存在很大的挑战。成立实体的数据治理组织还是建立一个虚拟的组织?人员安排是专职还是兼职?到底哪种性质的组织和岗位设置更好?这些是经常被企业管理层问及的问题。这里的回答是:根据企业的组织、管理现状而定;没有最好的组织模型,只有更合适企业的组织模式。
来源:大数观