数据治理的五大误区

文 | Smartbi大数据百科 2021-05-28 阅读次数:3869 次浏览

商业智能BI产品更多介绍:https://www.smartbi.com.cn/

商业智能BI产品更多介绍:点击前往

    数据治理的误区(一)没有数据治理策略

    如果你对自己说,”什么是数据治理?“那么你很有可能犯了这个错误。数据治理指的是定义组织如何确保使用的数据干净、准确、可用和安全的总体策略。

    当您的组织开始进行数据项目时,您通常会以特别的方式解决其中的一个或多个挑战。这种方法可能在一段时间内有效,但当您获得大数据成功并承担更复杂的项目时,缺乏治理可能会再次困扰您。

    数据治理策略有几个组成部分,包括:设置规定如何存储和保护数据的流程;制定一套标准和程序,以确保获授权人员可以查阅和使用数据;建立控制和程序以确保规则得到遵守。

    就像生活中的大多数事情和IT一样,数据治理并不是带着“设置好就忘记”的心态工作的。从您的数据治理计划开始,然后随着时间的推移使其不断优化,以满足您组织的特定需求。

    数据治理的误区(二)过度依赖独角兽

    许多电商在处理与大数据有关的所有事情时都求助于他们的数据科学家(即独角兽)。公司老板们希望他们的独角兽们能神奇地将原始数据转化为可操作的洞察力。这种方法可能不会长久奏效。事实是,如果你足够幸运,找到了一家独角兽公司,你就得付他们太多钱,让他们去做“数据看门人”,更不用说负责整个数据治理战略了。

    数据治理最好由来自IT部门、业务线和遵从性的一组数据涉众领导。数据治理研究所还建议雇佣一名数据治理官(DGO)。

    数据治理的误区(三)数据管理模式失控

    这种错误经常与数据湖的实现同时出现。HDFS的宽容使您能够将任何类型的数据、任何类型的模式扔到Hadoop数据湖中,然后再担心如何对其进行分类。这种“读取模式”方法可能适用于某些类型的数据,特别是那些经常更改且不能被归类到预先设定的模式中的数据。但是模式读取只能到此为止,在某种程度上,必须强制使用模式。

    Hadoop带来了大量的数据处理引擎,比如Spark、Pig和MapReduce,它们可以帮助你给数据赋予形状和形式——也就是说,使其可用。读取模式与核心数据治理原则相悖,核心数据治理原则要求您知道要存储和处理的数据类型。

    数据治理的误区(四)试图储存一切数据

    良好数据治理策略的重要方面之一是数据收集。在某种程度上,每一条数据都必须进入公司的数据回收箱。但通常情况下,企业决定再也不扔掉任何数据了。

    如果你的组织遵循“保持一切”的命令,祝你好运。可能需要很多额外的周期来维持腐烂的垃圾堆的秩序。据调查发现,如今一个组织存储的平均40%到60%的数据是冗余的、过时的或微不足道的(ROT)。

    组织每年花费数百万美元来存储他们永远不会使用的数据。这不仅是商业意识的失败,也是数据治理的失败。

    数据治理的误区(五)不使用自动化工具

    制定有效的数据治理策略,需要付出很多,需要合适的人来实现它,且需要一个好的策略来列出优先级和一般策略,还需要好的流程来在日常的基础上实现数据治理。

申请试用 了解更多

2024年度精选《思迈特制造行业BI最佳实践合集》

立即下载
Copyright© 广州思迈特软件有限公司  粤ICP备11104361号

电话咨询

售前咨询
400-878-3819 转1

售后咨询
400-878-3819 转2
服务时间:工作日9:00-18:00

微信咨询

添加企业微信 1V1专属服务