数据模型数据建模

巴克、陈氏、CDGP、Chen、ERW、ERWin、IDEF、IDEF1、IE、IT、NF、PowerDesigner、UML这些概念都来自第5章的CDGP知识点梳理,主要围绕数据建模展开。数据建模实际上是发现、分析和确定数据需求的过程,通过数据模型来表示和传递这些需求。它在数据管理中扮演着重要角色,对有效的数据管理至关重要。 业务驱动因素包括提供通用词汇表,让组织内外的数据交流有一个统一的语言和定义。同时,它还记录组织内数据和系统的详细信息,支持数据治理和管理活动。在项目中,数据建模是沟通工具,确保各方对数据需求有一致的理解。此外,它也是应用定制的起点,降低开发成本和风险。 数据建模的目标是确认和记录数据需求,把应用程序与当前和未来的业务需求紧密结合。它还为成功完成广泛的数据应用和管理活动奠定基础,降低支持成本。为了达到这些目标,数据建模需要遵循清晰性、准确性和完整性的原则。 基本概念方面,数据模型描述了组织已经理解或未来需要的数据,把这些需求从业务传递到IT。建模中会使用类别信息、资源信息、业务事件信息和详细交易信息等不同类型的数据。数据模型还包括实体、关系、属性和域这些组件。 数据建模方法有多种选择,如关系建模、维度建模、雪花模型、面向对象建模、基于事实建模、基于时间建模和非关系型建模等。每种方法都有其特定目的和特点。关系建模可以消除冗余,适用于设计操作型系统;维度建模优化查询和分析,适合海量数据;面向对象建模适合描述复杂系统;基于事实建模减少直观判断;非关系型建模适用于一些特殊情况。 数据模型可以分为概念模型、逻辑模型和物理模型三个级别。概念模型通常用于高层管理和业务用户之间的交流;逻辑模型提供详细描述;物理模型则描述技术解决方案。 规范化是一个重要的过程,它把复杂的业务转化为规范的数据结构。规范化主要目标包括保证每个属性只在一个位置出现,消除冗余。第一范式(1NF)、第二范式(2NF)和第三范式(3NF)是规范化的重要规则。 数据建模活动包括规划、建立、审核和维护等阶段。规划阶段需要定制合理的工作计划;建立阶段包括正向工程和逆向工程;审核阶段进行评审和验证;维护阶段根据业务变化和技术发展进行更新。 为了辅助数据建模过程,可以使用ERWin、PowerDesigner等工具;还可以利用数据分析工具对数据进行探索和分析;元数据资料库可以存储和管理元数据;还有数据血缘工具用于追踪数据来源去向。 整体来说,数据建模是一个系统而复杂的过程,需要综合运用各种方法和工具来实现其目标。通过合理规划和执行这些活动,企业可以更好地管理自己的数据资产。