数据信息湖布署中的5个数据信息整治挑戰

2021-02-22 05:52

取得成功的数据信息整治计划方案涉及到布署对策、规范和步骤,以在全部公司中合理正确地利人和用高品质数据信息。假如你的公司具备数据信息湖自然环境,并期待从中得到高品质的剖析結果,则你必须布署正确数据信息湖整治,做为总体整治方案的1一部分。

但数据信息湖给公司数据信息管理方法的各个方面都带来挑戰,包含数据信息整治。在刚开始探讨整治挑戰前,大家必须界定甚么是数据信息湖:1种可容下很多初始数据信息的数据信息服务平台,这些数据信息一般以其本机文件格式保存,直至必须用于剖析。

传统式的数据信息库房将数据信息储存在关联表格中,而数据信息湖则应用平面构造。每一个数据信息元素被分派唯1标志符,并用1组元数据信息标识开展标识。这便是说,数据信息湖沒有数据信息库房那末构造化。在浏览数据信息开展剖析时,数据信息会被归类和梳理,而并不是在将数据信息载入到数据信息湖中时。

合理的数据信息整治使公司可以提升数据信息品质和1致性,并很大水平地利人和用数据信息开展业务流程管理决策,从而能够改进业务流程整体规划和会计业绩考核。数据信息整治的配套数据信息管理方法学科包含数据信息品质、元数据信息管理方法和数据信息安全性性,全部这些要素都危害到数据信息湖整治。

如今,让大家看看下面5个数据信息湖布署中的数据信息整治挑戰。

1.鉴别和维护保养正确的数据信息源

在许多数据信息湖布署中,源元数据信息沒有被获得或压根不能用,这使得数据信息湖內容的合理性让人提出质疑。比如,将会未列出纪录系统软件或数据信息集的业务流程全部者,或明显冗余数据信息将会会给数据信息剖析人员导致难题。最少应纪录数据信息湖中全部数据信息的源元数据信息,并应用户可使用它来掌握其出处。

2.元数据信息管理方法难题

元数据信息为数据信息集內容出示情况信息内容,而且是使数据信息在运用程序流程中易于了解和可以使用的关键组件。可是许多数据信息湖布署忽视了对搜集的数据信息运用正确数据信息界定的要求。并且,因为初始数据信息一般被载入到数据信息湖中,许多公司沒有采用流程来认证数据信息或对其运用公司数据信息规范。缺乏适度的元数据信息管理方法使得数据信息湖中的数据信息对剖析的用途不大。

3.在数据信息整治和数据信息品质层面欠缺融洽性

不融洽的数据信息湖整治和数据信息品质工作中会致使劣质数据信息进到数据信息湖。当这些数据信息用于剖析并驱动器业务流程管理决策时,这将会致使結果禁止确,从而致使缺失对数据信息湖的自信心和全部公司对数据信息广泛不信赖。合理的数据信息湖布署必须数据信息品质剖析师和工程项目师与数据信息整治精英团队及数据信息管理方法员紧密协作,以布署数据信息品质对策、剖析数据信息并采用必要的对策来提升其品质。

4.在数据信息整治和数据信息安全性层面欠缺融洽性

在这类状况下,假如数据信息安全性规范和对策未被正确列入整治步骤中,将会会致使没法浏览受隐私保护政策法规和别的种类的比较敏感数据信息维护的本人数据信息。虽然数据信息湖旨在变成非常对外开放的数据信息源,但仍必须安全性性和浏览操纵对策,而且,数据信息整治和数据信息安全性精英团队应携手并肩进行数据信息湖设计方案和载入全过程,和不断的数据信息整治工作中。

5.应用同样数据信息湖的业务流程单位之间的矛盾

不一样单位针对类似数据信息将会具备不一样的业务流程标准,这将会致使没法融洽数据信息差别以开展精确的剖析。健全的数据信息整治计划方案应具备对数据信息对策、规范、步骤和界定的公司视角,包含公司业务流程语汇表,这可降低好几个业务流程单位应用同1数据信息湖时出現的难题。假如公司有好几个数据信息湖,则每一个数据信息湖都应包括在数据信息湖整治步骤中,并为其分派业务流程数据信息管理方法员。 总而言之,根据在数据信息湖的设计方案、载入和维护保养全过程中添加强劲的数据信息整治、元数据信息管理方法、数据信息品质和数据信息安全性步骤,并由全部这些行业的工作经验丰富多彩的技术专业人员积极主动参加,可明显提升数据信息湖的使用价值。不然,你的数据信息湖将会会变为数据信息沼泽地。



扫描二维码分享到微信

在线咨询
联系电话

020-66889888