这可能是全网最全的数据仓库建设方法论!
为了解决多数据源导致的口径不一致、数据无关联、数据质量差、缺少历史数据、开发效率低等问题,企业需要构建企业级数据仓库,对数据进行规整和高效利用。除此以外,由于直连业务系统支撑多方报表导致读写交叉性能降低,影响正常业务系统使用的问题也可解决。
构建企业级数据仓库的步骤分为调研、数仓设计、数仓实施和测试上线四个主要环节。

调研前期,需要明确本次项目在此阶段成功的要素,其次是划分责任矩阵,收集相关资料并制定合适的调研策略。与用户需求相关的信息应该足够的详细。最终要交付给最终用户项目计划及需求说明,需要的情况下需要制定灾备计划,以便数据仓库可以从事故中恢复。

调研责任矩阵
调研执行分为四步骤:
第一步对本次项目的目标,整体平台的范围和当前IT的技术架构进行调研与整理;第二步针对本期项目涉及业务部门进行单独访谈,明确指标,确认口径,梳理前端样式与功能并确定相应的数据标准;第三步可根据上一轮调研结果所设计的蓝图进行确认和修改并在数据侧对底层数据进行探源;最后将调研结果与方案蓝图进行最终的多方确认并审核签字。
这一阶段的交付物为系统蓝图框架与当前数据基础和质量情况表等,具体的执行过程见下图:


指标确认框架
数仓构建的核心工作是分层及建模,分层架构设计是为应用数据资源采集、存储、处理和交换提供建设性依据,而数据模型将决定数据仓库系统的增长性和性能,数仓一般分为 ODS(贴源层)层、DW 层(数据仓储层)、DM 层(数据集市层)三层架构,依据企业实际情况会有所调整,而数仓模型大多采用维度建模和范式建模。
数据分层:
每一个数据层都有它的作用域,在使用表的时候能更方便地定位和理解,因此需要针对数据进行分层建设,且数据分层也利于数据血缘追踪、屏蔽原始数据的异常,通过开发一些中间层,还可以起到减少重复开发的作用。

数仓通用技术框架
数仓建模的流程:
数仓模型的设计,按照概念模型(主题域模型)——逻辑模型——物理模型的流程进行,逻辑模型和物理模型通常采用维度建模的办法,以星型和雪花型模型来组织数据,维度建模的两个基本元素是事实表和维度表。而维度建模也分为确定业务主题、定义粒度、确定维度和确认事实表四个步骤。该阶段的交付物为针对数据源的概念模型、逻辑模型和物理模型。

数仓建模一般流程

DWD层维度建模步骤
ETL过程常常需要最长的项目时长,可能会占用数仓开发的50%及以上,因为获取源数据、理解业务规则、逻辑和物理数据模型需要花费大量时间。ETL 通过从源系统数据库实时同步数据至数据仓库贴源层,基础层、通用层、应用层基于贴源层的增量数据以实时指标加工的规则进行定时(T 1 天)加工处理。

ETL过程
测试上线
测试上线的主要目的是为了测试当前数仓开发完毕后数据是否准确,数据相应的速度是否及时,包括 ETL 任务的各环节是否出现异常等,测试完毕通过业务确认后即可上线。
数据规范
数仓建设的规范是为了后续开发人员可以遵从规范,培养良好的习惯,也可以提升数仓开发的可维护性,便于用户的沟通及交流。数据规范的内容包括数仓设计规范、命名规范、ETL 规范、报表规范等,数据规范建设为后续的数据治理及数据资产的管理建立了良好的基础。

数仓规范文档


太阳带着地球在飞速前进 每秒630公里 你知道目的地是哪吗
根据目前的宇宙学理论和观测数据,宇宙的起源可以追溯到约138亿年前。这个数字是通过研究宇宙背景辐射的性质和分布,以及对宇宙膨胀和演化的理论模型进行推导而得出的。宇宙背景辐射是宇宙早期的辐射遗迹,它源于宇宙在诞生时的高能状态,冷却而来的微弱微波辐射,是宇宙大爆炸的痕迹。一、天体运动我要新鲜事2023-12-23 20:36:590000为啥人类在被冻死之前反而要脱衣服 揭秘人体失温(失温现象)
人类在死之前脱掉自己的衣服是正常现象。现在已经正式进入到了冬天,相信很多地方的小伙伴儿都已经感受到了寒冷。不管是北方还是南方,只要是感觉冷的话,那肯定就是要穿上厚重的衣服才行。但是在一些电视剧或者是现实当中,我们却可以发现。在一些十分寒冷的地方,人们在被冻死之前反而是会脱掉自己的衣服。这是为什么的呢?难道他要着急让自己被冻死吗?其实这是一种叫做失温的正常现象,下面我们就来解释一下。人体的温度我要新鲜事2023-05-15 21:25:560000生活中必懂常识!12个可怕的生活黑客(棉花糖能减轻喉咙疼痛)
导语:生活中我们难免会遇到各种各样的问题,每个人都想解决问题,让生活更加轻松。正因为如此,很多人花了一些不必要的钱在不真正需要的设备和工具上,其实生活中实际上有很多生活黑客能帮助我们解决一些问题,让生活越来越美好!接下来呢就由探秘志小编为大家揭秘12个可怕的生活黑客吧!看完后你们一定能涨姿势~12个可怕的生活黑客1、防水鞋我要新鲜事2023-05-08 06:21:160000长沙的楼房发生倒塌事件 给人提供的逃生时间非常短暂 该如何自救
今年的四月份,位于湖南长沙的一栋高层建筑发生倒塌事件,这栋建筑物约有六层半,居民和住户非常多,目前,救援人员们正在紧张的解救被困人员。相对比其他的灾难而言,建筑物倒塌往往发生在瞬间当中,并且还没有任何的预兆,不会给人留够逃生时间。一旦发生这种类型的灾难,人们生还的可能性并不大,不知道毁坏了多少个家庭。如果真的不幸面临这样的险情当中,一定要保持一个冷静的头脑去应对各种突发状况。我要新鲜事2023-05-14 16:19:010000宇宙中比地球还大的生物,在真空中遨游以吞噬星体为生
在各种科幻电影和小说中,时常会描述堪比地球大小的生物体,比如《变形金刚》中的元始天尊塞伯坦星球,还有《银河护卫队2》中的巨大头颅,这些都是比地球还大的生物。科学家们曾设想过宇宙中如果有地球还大的生物存在,那它们很可能就是以吞噬星体为生。宇宙中比地球还大的生物真的存在我要新鲜事2023-05-07 19:17:420001