7 * 24
多渠道服务支持
1、DAMA
数据架构识别企业的数据需求,并设计和维护总蓝图以满足需求,使用总蓝图来指导数据集成、控制数据资产、并使数据投资与业务战略保持一致。主要包括数据模型、数据流设计。
2、华为数据之道
数据架构是指以结构化的方式描述在业务运作和管理决策中所需要的各类信息及其关系的一套整体组件规范。主要包括数据资产目录、数据标准、数据模型及数据分布。
3、DCMM
数据架构通过组织级数据模型定义数据需求,指导对数据资产的分布控制和整合,部署数据的共享和应用环境,以及元数据管理的规范。
4、Software Architecture Academy
数据架构是数据系统的蓝图,它满足产品的业务需求,并描述如何收集、存储、转换和分发数据。它由数据模型、治理策略、规则和标准组成,需要实施和遵循这些模型、治理策略、规则和标准,以构建强大而安全的数据系统。
5、IBM
数据架构描述如何管理从收集到转换、分发和使用的数据。它为数据及其在数据存储系统中流动的方式设定了蓝图。它是数据处理操作和人工智能 (AI) 应用程序的基础。
6、TOGAF 9.2
数据架构描述了一个组织的逻辑和物理数据资产及其数据管理资源的结构。从以上定义中,我们能看出一些共性,但似乎也说不清楚,然后我们回到第一性原理,看看架构的本质是什么。架构是对组件要素的设计,旨在优化整个结构或系统的功能、性能、可行性、成本和用户体验。在国际标准ISO/IEC/IEEE 42010:2011中,将架构定义为:“系统的基本结构、具体体现在架构构成的组件、组件之间的相互关系以及管理其设计和演变的原则”。综合以上所有的定义,最后得到了一个比较满意的定义:数据架构是对组织中数据资产的结构化表示,它涵盖了数据的定义、存储、组织、集成和管理方式,旨在提供一个清晰的蓝图,使组织能够有效地管理和利用其数据资产,确保数据的一致性、完整性和可访问性,支持业务需求和决策过程。但关于数据架构具体内涵是什么,包含哪些输出物,业界各有看法,比如《华为数据之道》认为数据架构应该包括数据资产目录、数据标准、数据模型及数据分布,如下图所示。
温昱在《业务架构.应用架构.数据架构实战》一书中认为数据架构应该包括数据类型及其来源、数据模型、数据存储、数据流及数据管理,如下图所示。
那么,数据架构到底应包含哪些内容呢?
首先,数据模型和数据流动是肯定入选的,因为无论是数据资产的结构化表示,还是定义数据实体和实体之间的关系,都与这两者有关,华为数据之道,DAMA也分别包含这两者。但数据实体除了与数据实体有关系外,还与业务和应用实体有关系,在TOGAF中体现这一关系的就是数据实体/业务功能矩阵和应用程序/数据矩阵,这些矩阵帮助定义和管理数据需求,确保数据架构能够有效支持业务流程的执行和优化,并且实现数据在不同业务功能中的一致性和完整性,因此我认为数据实体/业务功能矩阵、应用程序/数据矩阵即数业映射应成为数据架构的一部分。其次,数据管理和数据治理也应入选,前者明确了数据管理的方法和流程,后者通过制定和执行数据管理的政策、标准和流程,确保数据在创建、存储、处理和使用过程中保持一致和完整性,TOGAF和Software Architecture Academy也有类似的观点。再次,我认为数据架构应该包括数据声明,描述清楚数据架构的实施愿景、范围和目标等内容,作为评估数据架构成功执行的依据,也应包括数据原则,用于指导企业架构设计和实施的基本准则和指导方针,例如,“数据是企业的资产”、"确保数据安全和隐私"等。最后,参考TOGAF在数据架构中给出的主要输出物,包括数据实体/数据组件目录、数据实体/业务功能矩阵、应用程序/数据矩阵、概念数据图、逻辑数据图、数据传播图、数据安全性图、数据迁移图、数据生命周期图等,可以认为数据模型、数据流动、数据管理等属于数据架构的重要组成部分。基于以上分析,我认为数据架构的主要输出物包括6个方面,分别是数据声明、数据原则、数据模型、数据流动、数据管理及数据治理。
(1)数据声明
架构工作声明是TOGAF架构开发方法(ADM)中的关键文档之一,用于详细描述架构开发的范围、方法、资源和计划。它定义了架构项目的基本框架和预期成果,数据申明是其中的一部分。
(2)数据原则
架构原则是用于指导企业架构设计和实施的一组基本准则和指导方针。它们帮助确保架构的一致性、灵活性和可扩展性,使架构决策在不同的项目和团队中保持一致。架构原则通常由组织的高级管理层和架构师共同制定,并在整个组织中推广和遵循。
(3)数据模型
定义数据元素、它们的属性以及数据元素之间的关系。输出物包括概念模型、逻辑模型、物理模型、数据目录等等。
(1)概念模型概念模型是高层次的抽象模型,用于描述业务实体及其关系,主要面向业务用户和利益相关者。它通常不涉及技术细节,而是强调业务需求。下面是在线书店的概念模型图:
图中包含四个实体:Customer(客户)、Order(订单)、Book(书籍)和Payment(支付)。实体之间的关系如下:Customer下Order:一对多关系(1:N)Order包含Book:多对多关系(N:N)Order有Payment:一对一关系(1:1)(2)逻辑模型逻辑模型是对概念模型的进一步细化,描述数据的结构和关系,但不涉及具体的数据库实现细节。逻辑模型详细定义了数据元素、属性及其关系,面向系统分析师和设计师。下面是在线书店的逻辑模型图:
图中包含五个实体:Customer(客户)、Order(订单)、OrderItem(订单项)、Book(书籍)和Payment(支付),每个实体标注了属性,各实体之间的关系如下:Customer下Order:一对多关系(1:N)Order有OrderItem:一对多关系(1:N)OrderItem包含Book:多对多关系(N:N)Order有Payment:一对一关系(1:1)(3)物理模型物理模型是对逻辑模型的进一步细化,描述具体的数据库实现细节。物理模型包括表、列、数据类型、索引、约束等,面向数据库管理员和开发人员。下面是在线书店的物理模型图:
图中包含五个实体:Customer(客户)、Order(订单)、OrderItem(订单项)、Book(书籍)和Payment(支付)。每个实体包括其属性和数据类型,各实体之间的关系如下:Customer下Order:一对多关系(1:N)Order有OrderItem:一对多关系(1:N)OrderItem包含Book:多对多关系(N:N)Order有Payment:一对一关系(1:1)(4)数据目录数据目录提供了一个中央存储库,用于管理和发现数据模型资产,数据目录帮助组织确保数据的一致性、可发现性和可管理性。
特别声明: 本文版权归原作者所有,本文所用图片、文字如涉及作品版权,请第一时间联系我们删除。本平台旨在提供行业资讯,不代表本站立场!
Notice: The copyright of this article belongs to the original author. If the pictures and text used in this article involve the copyright of the work, please contact us to delete the first time. This platform is intended to provide industry information and does not represent the position of this site