跳至主要内容

AWS 上的分析

通过 AWS 进行数据治理

在数据访问和控制之间取得平衡,加快数据驱动型决策

概述

使用 AWS 进行数据治理可以让合适的人员和应用程序在需要时轻松安全地查找、访问和共享正确的数据,从而帮助组织加快数据驱动型决策。您可以通过自动化的数据集成和数据质量管控来整理数据,以限制数据副本的数量。您可以通过集中式目录来发现和理解您的数据,从而提高数据素养。您可以通过精确的权限来保护您的数据,从而放心地共享数据。您还可以通过监控和审核对数据的访问来降低风险并改善合规状况。
Infographic depicting the AWS data governance circle, highlighting analytics and machine learning (ML) governance. The diagram features three main segments: Curate, Protect, and Understand, surrounding central concepts of data governance, analytics, and ML governance, with related activities such as data profiling, data lineage, data catalog, data security, data compliance, data lifecycle, data quality management, data integration, and master data management.

通过 AWS 进行数据治理的优势

    识别和管理最有价值的数据来源,包括数据库、数据湖和数据仓库,从而限制关键数据资产的副本数量和冗余转换。要整理数据,还必须确保正确数据的准确性和新鲜度,并识别出敏感信息,让用户可以信赖驱动决策和应用程序的数据。

    发现并理解数据的意义,以便数据消费者可以放心地使用数据推动业务价值。通过集中式数据目录,可以轻松找到数据,可以请求访问权限,还可以使用数据来做出业务决策。

    在数据隐私、安全和访问之间取得平衡。使用对业务用户和工程用户都非常直观的工具,跨组织边界治理数据访问。

    了解数据的使用过程和使用者。AWS 服务可帮助您监控和审核数据访问(包括通过机器学习模型进行的访问),以帮助确保数据安全性和监管合规性。机器学习还需要审核透明度,以确保负责任使用和简化报告流程。

利用 AWS 解决数据治理难题

    由于业务线(LOB)各自为政,数据以多种开放或专有格式存储在多种存储设备中,因此企业对可用数据的全貌了解有限。这个盲点使未纳入考虑的数据面临治理风险。

    数据治理不善会导致另一种无序扩张:为便于访问而创建数据副本。随着数据被频繁复制,其作为企业真实信息来源的可靠性会降低。这种做法有时会导致数据副本随处可见(可能会略有修改),表现为多个 LOB 的数据湖互不关联,且未经治理。

    即使企业整理并审视其全部数据,仍然难以理解它们的含义,因为几乎没有语义信息可以解释这些数据。 

    随着组织中数据用户数量的增长,寻找并分享推动决策的最佳数据资产,以开展有针对性的业务活动将变得困难重重。

    随着公司管理的数据变多,覆盖的用户变广,将越来越难以增强和维持其确保组织内外正确用户获取正确数据的能力。

    过于严格的访问控制会减缓业务决策速度。过于宽松的访问控制则可能会引发风险。

    随着企业的监管和合规义务范围扩大,企业往往难以了解谁在访问数据,以及该访问是否符合政策和合规性法规。

通过 AWS 大师班学习数据治理

数据治理如何加速推进您的业务计划? 如何利用现有的企业功能制定数据治理路线图并确保资金安全? 在本次数据治理大师班中,Kevin Lewis 将指导您解决常见的失误,并提供行之有效的最佳实践。

了解有关数据治理大师班的更多信息

阅读有关“什么是数据治理?”的更多信息

管理数据湖中的数据

使用 AWS 集中管理和扩展细粒度的数据访问权限。
查看信息图表