前言

        随着数字化时代的快速发展,数据已经成为企业和组织的核心资产。数据仓库作为组织中管理和分析数据的关键平台,其建设规范对于确保数据的准确性和完整性至关重要。

一、数仓模型架构

在构建数据仓库时,首先需要明确模型架构,以确保数据仓库的高内聚和低耦合,以及数据的分层管理。

1、数仓基本分层结构

2、主题域划分

2.1 什么是数仓主题        

数仓主题是指通过“上帝视角”将企业不同业务流程信息进行分类、汇总,然后对其进行分析利用的一个抽象化概念。也是企业中某一分析领域具体的分析对象,每个数仓分析领域都又一个数仓主题相呼应。

2.2 数仓主题域如何划分

数仓主题域是将业务对象高度概括的概念层次归类,目的是便于数据的管理和应用。数仓主题域可以进一步细分为不同的主题。

在实际搭建数仓的过程中,一般都把一个比较深层次的主题或者部分主题当作核心,围绕其进行建设。这种建设由于涉及到主题的选择,必须先由最终用户和数仓建设人员共同确认主题,然后完成搭建过程。

划分主题域需要数仓建设人员充分了解业务流程,通过总结和分析清楚各个不同的业务流程都有哪些业务参与其中。

2.2.1 按照业务系统划分

业务容易理解,就是指功能模块、业务线。在大部分企业都已经经历过信息化建设或正在信息化建设过程中,企业各种业务系统都已经部署完成,比如:财务部-财务系统、销售部-销售系统、生产部门-生产系统、供应链部门-供应链系统...等等。

不同的业务系统,只会存储对应业务流程中产生的数据,下级数据主题都互相紧贴,是天然的主题域,业务系统有几种,就可以划分为几种主题域。

2.2.2 按照需求划分

企业需要长期对某一方向进行分析,这个长期分析的过程中涉及多个主题,会对数据进行细分、归纳等,在这个过程中,就由需求产生了主题域。

比如说,销售分析,这个分析过程中涉及对象有产品、仓库、经销商、顾客等等,其中每一个分析对象就是数仓的一个主题,而包含、归纳这些主题的销售分析就成为了一个对应的主题域。

2.2.3 按照功能划分

在当今社会,软件app是每个加入互联网的人都会使用的东西,这些由企业开发的软件拥有不同的功能模块,比如说社交软件:聊天、群聊、朋友圈、文件发送等功能。从这些功能中选一个米快,,譬如“聊天模块”会涉及用户主题、文字主题、语音主题、文件主题等,所以聊天模块也能被归纳为聊天主题域。

文章来源

评论可见,请评论后查看内容,谢谢!!!
 您阅读本篇文章共花了: